K.U. 29-03-2006 Metode Skriveøvelse 1 Af Marie Hammer og Steffen Tiedemann Christensen. Indholdsfortegnelse... 1. Opgave 1... 2. Opgave 2...



Relaterede dokumenter
Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Kausalitet. Introduktion til samfundsvidenskabelig metode. Samfundsvidenskabelig metode. Hvad er metode? Hvad er kausalitet.

c) For, er, hvorefter. Forklar.

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Note til styrkefunktionen

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Program dag 2 (11. april 2011)

Rapport vedrørende. etniske minoriteter i Vestre Fængsel. Januar 2007

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Konfidensintervaller og Hypotesetest

- Medlemsundersøgelse, Danske Fysioterapeuter, Juni Danske Fysioterapeuter. Kvalitet i træning

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Statistik II 1. Lektion. Analyse af kontingenstabeller

for gymnasiet og hf 2016 Karsten Juul

Valgkampens og valgets matematik

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

temaanalyse

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

FORDELING AF ARV. 28. juni 2004/PS. Af Peter Spliid

Del 3: Statistisk bosætningsanalyse

Supplerende notat om kommunale kontrakter

Maple 11 - Chi-i-anden test

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Notat // 05/11/07 IKKE FLERTAL FOR DE OFFENTLIGT ANSATTES LØNKRAV MEN DE OFFENTLIGT ANSATTE ER POSITIVE

Personlig stemmeafgivning

Løsning eksamen d. 15. december 2008

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

enige i, at der er et godt psykisk arbejdsmiljø. For begge enige i, at arbejdsmiljøet er godt. Hovedparten af sikkerhedsrepræsentanterne

Test og sammenligning af udvalgte regressionsmodeller Berit Christina Olsen forår 2008

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

02402 Løsning til testquiz02402f (Test VI)

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Flertal for offentliggørelse af skoletests men størst skepsis blandt offentligt ansatte

Løsning til eksaminen d. 14. december 2009

4. september π B = Lungefunktions data fra tirsdags Gennemsnit l/min

Modul 5: Test for én stikprøve

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

April Højtuddannede i små og mellemstore virksomheder. Indhold

Vejledende besvarelser til opgaver i kapitel 14

ANALYSEBUREAUET OGTAL ANALYSEBUREAUET OGTAL EU-OPSTILLING UNDERSØGELSE AF EU-OPSTILLING FOR ENHEDSLISTEN

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Det siger FOAs medlemmer om smartphones, apps og nyheder fra FOA

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Tekniske specifikationer: De oprindelige spørgsmålsnumre skal med i rapporteringen (SPSS inkl. Vægte)

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Sygeplejersker og stikskader

TILLIDEN MELLEM DANSKERE OG INDVANDRERE DEN ER STØRRE END VI TROR

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Eksempel på logistisk vækst med TI-Nspire CAS

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Et oplæg til dokumentation og evaluering

Generelt er korrelationen mellem elevens samlede vurdering i forsøg 1 og forsøg 2 på 0,79.

Statistiske modeller

Danskerne vil have velfærd - men også skattelettelser

Side 1 af 6. Teglværksgade København Ø. Tlf analyse@cevea.dk

Multipel Lineær Regression

LEGALT PROVOKEREDE ABORTER FORDELT PÅ ETNICITET

SPSS introduktion Om at komme igang 1

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

Råd og vink 2013 om den skriftlige prøve i Samfundsfag A

Undersøgelse om produktsøgning

Forslag til folketingsbeslutning om udflytning af statslige arbejdspladser

2.0 Indledning til registerstudie af forbrug af sundhedsydelser

Faktaark: Iværksættere og jobvækst

Notat. Metodeappendiks

- Panelundersøgelse, Folkeskolen, september 2014

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

LØNDANNELSE BLANDT MEDLEMMER AF IDA HOVEDKONKLUSIONER OG SURVEYRESULTATER

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning

Holdninger til socialt udsatte. - Svar fra danskere

Befolkning og valg. Befolkning og valg. 1. Udviklingen i Danmarks befolkning. Statistisk Årbog 2002 Befolkning og valg 37

Hvert femte FOA-medlem forventer ikke at kunne arbejde, til de når folkepensionalderen

Danskernes viden om kvinder og politisk repræsentation

Borgerlige vælgere sender blå blok på bænken

Det sorte danmarkskort:

det offentlige Hilsner fra sådan vil danskerne tiltales BJERG KOMMUNIKATION FLÆSKETORVET 68, KØBENHAVN V T: KONTAKT@BJERGK.

Klar sammenhæng mellem børns og forældres livsindkomst

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Behandling af kvantitative data

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

KØBENHAVNS UNIVERSITET, ØKONOMISK INSTITUT THOMAS RENÉ SIDOR,

Det siger FOAs medlemmer om ulighed i Danmark

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Besvarelse af opgavesættet ved Reeksamen forår 2008

En ny vej - Statusrapport juli 2013

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Effekt af blinkende grønne fodgængersignaler

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Løsning til eksamen d.27 Maj 2010

Matematik B. Højere handelseksamen

for matematik pä B-niveau i hf

Konfidensinterval for µ (σ kendt)

Transkript:

Indholdsfortegnelse Indholdsfortegnelse... 1 Opgave 1... 2 Opgave 2... 2 Forforståelse:...2 Deskriptiv statistik:...3 Overvejelser:...12 Opgave 3... 13 Opgave 4... 15 Opgave 5... 16 Opgave 6... 17 Konklusion:...20 Opgave 7... 21 P-værdi & Konklusion:...22 Opgave 8... 22 Konklusion:...24 Opgave 9... 25 Konklusion:...26 Opgave 10... 27 Konklusion:...28 Opgave 11... 28 Konklusion:...30 Opgave 12... 30 Vurdering og perspektivering...32 Opgave 13... 33 ALDER...33 Politik...36 Overvejelse og diskussion:...37 Litteraturliste... 39 Side 1 af 39

Opgave 1 De to datasæt, kommunale nøgletal og stikprøveundersøgelsen, flettes. Det flettede datasæt benyttes til at analysere problemstillingen Hvilke faktorer har betydning for opfattelsen af indvandring som en alvorlig trussel?. Opgave 2 (Ved Marie Hammer) Vi har valgt følgende 4 kommunale variabler, som, vi mener, har betydning for opfattelsen af indvandring som en alvorlig trussel. Var. 6: Andel af 67+ Var. 19:Fuldtidsledige pr.100 17-66 årige Var. 22:Asylansøgere pr. 10.000 indb. Var 62: Indtægter fra indkomstskat pr. indb. Forforståelse: Var.6 Hypotesen: Forforståelse: Des større andel af indbyggere i aldersgruppen 67 og derover, des flere vil opfatte indvandring som en alvorlig trussel. Det antages, at de ældre befolkningsgrupper har ringe kendskab til indvandrer udover mediernes generelle billede af indvandring som en trussel. Dette skal ses ud fra, at de ikke er opvokset med indvandrere og ikke er stødt på dem i eksempelvis uddannelsessystemet og på arbejdspladsen i samme grad som yngre generationer og har derved intet personlig kendskab til indvandring som en trussel eller ej. Var.19 Hypotesen: stiger i takt Forforståelse: Andelen, der opfatter indvandring som en alvorlig trussel, med at andelen af fuldtidsledige øges. Det antages, at truslen fra indvandring i høj grad også omfatter frygten for at miste arbejdspladser. Her vil de fuldtidsledige føle sig mere truet end beskæftigede. Side 2 af 39

Var.22 Hypotesen: Forforståelsen: K.U. 29-03-2006 Metode Skriveøvelse 1 Des flere asylansøgere pr.10.000 indbyggere en kommune har, des flere vil opfatte indvandring som en alvorlig trussel. Det antages, at større grupper asylansøgere forstørrer synligheden og opmærksomheden på indvandring blandt indbyggere i kommuner med mange asylansøgere. De problemer, der opstår i forbindelse med indvandring, bliver ligeledes forøget idet indvandrergruppen forøges og bliver et relativt større problem for kommunen. Var.62 Hypotesen: Forforståelse: Når størrelse på indtægter fra indkomstskat per indbygger stiger, falder andelen af indbyggere, der mener indvandring udgør en trussel. Denne variabel hænger til dels sammen ved var.19. Højt uddannede med høj indkomst, er ikke i sammen grad i fare for at miste job, som dele af befolkningen med ufaglært job og mellemlange uddannelser. Ydermere kan det tænkes, at indbyggere med høje indkomster ikke i sammen grad oplever indvandringen i hverdagen, da indvandrerne ikke bor i disse områder. Der er altså i modsætning til var.22 tale om en manglende synlighed af den mulige trussel fra indvandring. Deskriptiv statistik: Til beskrivelsen af stikprøverne for de 4 udvalgte variabler er som udgangspunkt valgt følgende data: Side 3 af 39

- Gennemsnit - Median - Maksimum - Minimum - Standardafvigelse, den gennemsnitlige afvigelse for data ift. gennemsnittet. Desuden er der lavet histogrammer med normalfordelingskurve for at kunne se, hvordan variablen fordeler sig og box-plots for at udpege eventuelle outliers. Var.6: Variablen dækker over andel indbyggere i aldersgruppen 67 og derover i respondentens kommune. Andel 67+-årige N Valid 275 Missing 0 Mean 13,6149 Median 13,5000 Std. Deviation 2,75891 Minimum 5,40 Maximum 24,20 Gennemsnitlig andel ligger på 13,6149 og medianen på 13,5000 (Agresti og Finlay, 1997:45-48). Median og gennemsnit ligger så tæt på hinanden, at der givetvis er tale om en normalfordeling. Antallet i kommunerne spænder fra 5,40 som minimums andel til et maksimum på 24,20, og der er således en forholdsvis stor range på 18.8. (Agresti og Finlay, 1997:56). Ud fra den relative lille standardafvigelse på 2,75891 (Agresti og Finlay, 1997:58), skyldes den store range givetvis i høj grad enkelte outliere. Side 4 af 39

At der er tale om en tilnærmelsesvis normalfordeling ses ud fra histogrammet og den indlagte normalfordelingskurve, hvor der dog er en lille skævvridning på midten mod højre. Box-plottet understreger hvorledes medianen ligger meget nær gennemsnittet, hvor de to arealer for nedre og øvre kvartil er cirka lige store (Agresti og Finlay, 1997:53). Box-plottet viser også, at der er en mængde outlier, der ligger mellem 1,5 og og et par stykker på 3 interkvartil range (boksenslængde fra øvre til nedre hjørne). De to ekstreme outlier, der vises i box-plottet, med en afvigelse på mere end 3 interkvartil range er Tranekær og Ærøskøbing fra Fyns amt. Box-plotte tydeliggør således, hvorledes de fleste respondenters kommuner ligger sig tæt op af hinanden på midten for denne variabel og understreger, at den store range skyldes outliere. (Agresti og Finlay, 1997:62-64) Side 5 af 39

Var.19: Variabel viser fuldtidsledige pr.100 17-66 årige i respondentens kommune. Fuldtidsledige pr. 100 17-66-årige N Valid 275 Missing 0 Mean 4,1182 Median 3,9000 Std. Deviation 1,24330 Minimum 2,10 Maximum 9,90 Igen ses det, at gennemsnit på 4,1182% fuldtidsledige blandt de 17-66 og median på 3,9000% ligger tæt på hinanden, så der er givetvis tale om en tilnærmelsesvis normalfordeling. Kommunen med flest fuldtidsledige har 9,90%, mens kommunen med færrest fuldtidsledige har 2,10. Disse er henholdsvis Læsø og Ledøje-Smørum kommune. Der er dog givetvis tale om outliere, der ligger til grund for den store range, da standardafvigelsen er relativ lille på 1,24330. At dette netop er tilfældet viser histogrammet, hvor der er tale om en højreskæv tilnærmelsesvis normalfordeling, hvor maksimum, som nævnt, kun er repræsenteret ved en ekstrem outlier. Side 6 af 39

Box-plottet tydeliggør dette yderligere, hvor Læsø er eneste outlier på over 3 interkvartil range, men ellers fordeler kommunerne sig fint omkring midten. Øvre kvartil er en smule større end nedre kvartil, idet der er tale om en højreskæv normalfordeling. Var.22: Variablen viser andelen af asylansøgere pr. 10.000 indbyggere i respondentens kommune. Asylansøgere pr. 10.000 indb. N Valid 275 Missing 0 Mean 36,67 Median 2,00 Std. Deviation 104,568 Minimum 0 Maximum 1023 For denne variabel ses en betydelig difference mellem gennemsnittet på 36,67 asylansøgere pr.10.000 indbygger og medianen på 2,00, hvilket tyder på, der ikke er tale om en normalfordeling. Der er tale om en relativ stor range, der strækker sig helt fra et minimum på 0 til 1023 som maksimum. Standardafvigelsen på 104,568 vidner om, at det muligvis er outliere, der ligger til grund for den høje range, og ikke store forskelle fra kommune til kommune. Side 7 af 39

Histogrammet viser netop dette billede. Rigtig nok er der ikke tale om en normalfordeling, og den høje range skyldes ikke en generel stor forskel på kommunernes antal af asylansøgere pr.10.000 indbygger. Størstedelen af kommuner koncentrerer sig omkring 0 og 50 asylansøgere per 10.000 indbygger, mens de resterende kommuner primært fordeler sig mellem 50 og 400 asylansøgere per 10.000 indbygger. Bo-plottet tydeliggør, at der er tale om en stærk koncentration omkring medianen, og at den store range skyldes mange ekstreme outliere på over 3 interkvartil range. Set ud fra den stærke koncentration omkring medianen, må der siges at være en relativ høj standardafvigelse, men dette forårsages i høj grad af de ekstreme outliere i kraft af deres antal. Side 8 af 39

Var.62: Denne variabel viser respondentens kommunes indtægter fra indkomstskat per indbygget. Indtægter fra indkomstskat pr. indb. N Valid 275 Missing 0 Mean 23243,95 Median 22398,00 Std. Deviation 3763,274 Minimum 18527 Maximum 50058 Det ses, at der i kommunen med mindst indtægt fra indkomstskat får 18527kr. pr. indbygger, mens den med størst indtægt får 50058kr. pr. indbygger. Range ligger således på 31531kr. pr. indbygger, så der må siges at være tale om en forholdsvis stor spredning i denne variabel. Ydermere ses det, at medianen er 22398kr. og gennemsnittet ligger på 23243.95kr. Disse ligger relativt tæt, hvilket tyder på, der er tale om en normalfordeling, dog med en standardafvigelse på 3763,274kr.. Side 9 af 39

Ud fra histogrammet ses, at den store spredning skyldes outliere, og at der ikke tydeligt er tale om en tilnærmelsesvis normalfordeling. Der er tale om en koncentration til venstre for midten, hvor den høje standardafvigelsen skyldes, at de resterende kommuner ikke fordeler sig på begge sider ud fra midten, men primært til højre for koncentrationen. At der er tale om outliere ses tydeligt ud fra box-plottet. Her ses en del ekstreme outliere på mere end 3 interkvartil range. De 3 øverste ekstreme outlier repræsenterer Søllerød, Gentofte og Hørsholm Kommune. At de resterende kommuner fordeler sig til højre for medianen, ses også idet arealet for øvre kvartil er større, end det for nedre og alle outliere ligger over de 1,5 interkvartil range og dermed til højre i histogrammet. Beskrivelse af stikprøven for var.14, Opfattelsen af indvandring som en alvorlig trussel : De 6 svarmuligheder var: (1) Helt uenig, (2) Delvis uenig, (3) Hverken enige eller uenig, (4) Delvis enig, (5) Helt enig, (6) Ved ikke. Til denne beskrivelse er valgt gennemsnit, median og mode, som ved foregående beskrivelser. Ydermere er der inddraget et histogram og en frekvenstabel, for at kunne se svarfordelingen fra respondenterne. Side 10 af 39

INDVAND. ALVORL. TRUSSEL N Valid 1000 Missing 0 Mean 2,74 Median 2,00 Mode 1 Gennemsnittet ligger på 2,74 og medianen på 2,00. Da vi ud fra svarmulighederne ved at 3,5 er midten, er der ikke tale om en normalfordeling, men en vægtning mod venstre. Mode, det mest hyppige svar fra respondenten (Agresti og Finlay, 1997:54), er 1 altså helt uenig, men da hverken median eller gennemsnit ligger meget langt fra midten, må der også være en del, der svarer i den anden ende, altså omkring 5, helt enig. INDVAND. ALVORL. TRUSSEL Valid Frequency Percent Valid Percent Cumulative Percent Helt uenig 363 36,3 36,3 36,3 Delvis uenig 150 15,0 15,0 51,3 Hverken enig eller uenig 116 11,6 11,6 62,9 Delvis enig 141 14,1 14,1 77,0 Helt enig 220 22,0 22,0 99,0 Ved ikke 10 1,0 1,0 100,0 Total 1000 100,0 100,0 Beskrivelsen bekræftes ud fra frekvenstabellen, hvor 36,3 % af respondenterne har svaret 1, og en overvejende del på 62,9 % har svaret 1, 2, eller 3 der er altså tale om en vægtning mod venstre. Ligeledes holder beskrivelsen omkring, at en del må svare 5 eller 6 for at balancerer gennemsnit hen imod de 2,74, da hele 22,0% svarer helt enig. Side 11 af 39

Til slut viser histogrammet, at der er tale om en u-formet fordeling (Agreti og Finlay, 1997:44). De fleste respondenter har en klar opfattelse af, hvorvidt indvandring udgør en alvorlig trussel, idet hele 58,3% enten er helt enig eller helt uenig, og kun 1% svarer ved ikke. Flertallet af respondenterne mener, at indvandring ikke udgør nogen trussel. Overvejelser: (1) De 4 valgte variabler er bestemt ikke de eneste i datasættet, der er interessante i beskrivelsen af problemstillingen. Eksempelvis kunne omfanget af vold og tyveri, bevirke en øget andel, der mener indvandring udgør en alvorlig trussel. Her er var.25, anmeldte tyverier/indbrud per 1.000 indbygger og var.26 anmeldte voldsforbrydelser per 1.000 indbyggere relevante. Et andet eksempel kunne være andelen af tosprogede elever pr. 100 elever, var.153, der ligesom var.22 øger synligheden, og muligvis også opfattelsen af indvandring som en trussel. En anden mulighed er var.11, andel almennyttige boliger, der indirekte fortæller noget om uddannelses- og indkomstniveauet og evt. om indvandrerne er samlet i ghettolignende områder, der kunne bidrage til opfattelsen af dem som en trussel i respondentens kommune. Der er således mange eksempler på variabler, der i grunden ligeså godt kunne inddrages. (2) Variabel 6 andel 67+ og variabel 19, fuldtidsledige per 100 17-66-årige er begge problematiske, idet vores hypoteser omkring disse er meget normative. Fuldtidsledige bor måske i højere grad dør om dør med indvandrer i Side 12 af 39

almennyttigt boligbyggeri og har skabt et venskab/kendskab til dem, der mindsker det negative billede fra medierne. Ligeledes har det vist sig, at ældre i højere grad forstår indvandres stærke religiøse og familiære kultur og har et kendskab til dem gennem social- og sundhedssektoren, der muligvis gør dem mere åbne overfor indvandring. Vores hypoteser kunne således skrives lige omvendt, men vi mener nu, de skrevne er mest sandsynlige, hvor frygten for, at arbejdspladser tages hos fuldtidsledige og det manglende kendskab hos de ældre, vejer tungest. Variabel 22, andel af asylansøgere per 10.000 indbygger, fortæller os muligvis intet om andelen af indvandrere i kommunen. Dette er problematisk idet hele opgaven og respondenterne ikke skelner imellem asylansøgere, flygtninge med midlertidig eller permanent opholdstilladelse og andre termer for ikke etnisk danskere i Danmark, men skal forholder sig mere generelt til termen indvandring. Den almindelige dansker skelner højst sandsynligt ikke mellem disse forskellige termer, når der skal svares på, hvorvidt indvandring udgør en trussel eller ej, så variablen har muligvis ingen betydning for opfattelsen af indvandring som en alvorlig trussel. Ved at addere andelen af asylansøgere med variabel 24, andelen af statsborgere fra 3. lande, ville man have lavet en variabel, der dækker indvandring begrebet mere bredt og dermed styrker hypotesens betydning. For variabel 62, indtægter fra indkomstskat per indbygger, er der ligeledes nogle problemer idet, der sættes lighedstegn mellem velstand og indkomst og eksempelvis medregnes friværdi ikke. Vi vil dog ikke vurdere dette problem som værende afgørende for variablens betydning. Et andet problem ved denne variabel er at kommuneskatten ikke er ens og forskelle i indtægt kan således skyldes forskelle her og ikke i selve indkomsten. Store forskelle må dog alligevel tillægges indtægtsforskelle. Opgave 3 (Ved Steffen Tiedemann Christensen) For at estimere andelen af respondenter, der er helt eller delvist enige i, at indvandring udgør en alvorlig trussel mod vores nationale egenart, kan vi med fordel konstruere en ny ja/nej-variabel, der specificerer, om respondenten indirekte har svaret Ja til spørgsmålet Er du enig i, at indvandring udgør en alvorlig trussel mod vores Side 13 af 39

nationale egenart? (Det vil sige folk, som er kodet i datasættet som 4 eller 5 i V14). Svarene i denne variabel fordeles således: Med udgangspunkt i vores nye variabel kan vi sige, at 361 respondenter har svaret positivt på det indirekte spørgsmål, mens 639 respondenter har svaret Nej eller Ved ikke (dvs. at de har svaret Helt uenig, Delvis uenig, Hverken uenig eller enig eller Ved ikke på det oprindelige spørgsmål). Konfidensintervallet for andelen er nu defineret som ˆ ˆ ˆ (1 ˆ ) ± z ˆ, hvor ˆ n ˆ =. Vi ved hér, at ˆ = 36,1% = 0, 361 og n = 1000, mens et konfidensinterval på 95% betyder, at z 1, 96. Derfor er konfidensintervallet: ˆ (1 ˆ ) 0,361(1 z ˆ ˆ = z 1,96 1000 n 0,361) 0,030 Vi ved derfor med udgangspunkt i undersøgelsen, at andelen af den danske befolkning, som anser indvandring som en trussel mod den nationale egenart befinder sig i intervallet: 36,1% ± 3,0% = (33,1%; 39,1%) For at bestemme størrelsen, n, af den nødvendige stikprøve, hvis konfidensintervallet højest må have en bredde på 2%, må vi løse ligningen: 2 0,361(1 0,361) 1,96 0,361 (1 0,361) 0,01 = 1,96 n n = 2 0,01 = 8862 Side 14 af 39

Altså havde konfidensintervallet været (35,1%; 37,1%), hvis stikprøven havde været baseret på 8862 respondenter frem for blot 1000. Opgave 4 (Ved Steffen Tiedemann Christensen) Variablen Statborgere fra 3. lande pr. 10.000 indbyggere fordeler sig således i stikprøven: Gennemsnittet, Y, er altså 351,4 og standardvariationen, s, er 208,4 dét udgangspunkt bruger vi til at inddele respondenterne i kategorierne Lav, Middel og Høj. Vi starter med at definere Middel som Y ± 0, 5s, så: Kategorisering: Antal statsborgere fra 3.-lande per 10.000 indbyggere Lav: 247,2 eller færre Middel: Mellem 247,2 og 455,6 Høj: 455,6 eller flere (Alternativet til at vælge en kategorisering som 0-400, 400-800 og 800-? er, at vi med vores inddeling har relativt mange respondenter på hele spektret fra lav til høj. Ulempen er selvfølgelig, at der er stor variation indenfor Høj-kategorien: Fra 455 til omkring 1300. Vi har dog valgt at fortsætte med denne inddeling, da der trods alt ikke er specielt mange respondenter i Høj-kommunerne. Og alternativet kan betyde problemer med statistiske tests senere i opgavens forløb.) Med kategoriseringen på plads, kan vi nu kode en ny variabel, der inddeler stikprøven herefter. Et histogram med samme data, men de nye kategoriseringer indeholder nu: Side 15 af 39

Det er tydeligt fra dette nye histogram som det også var med udgangspunkt i de oprindelige data at de fleste respondenter bor i kommuner med enten relativt små eller mellemstore andele af statsborgere fra 3.-lande, mens relativt få respondenter/kommuner i stikprøven bor i kommuner med mange sådanne statsborgere. Det betyder altså, at fordelingen er højreskæv. Opgave 5 (Ved Steffen Tiedemann Christensen) Fra SPSS kan vi hente følgende statistik for variablen Indtægter fra indkomstskat pr. indbygger stadig med udgangspunkt i vores stikprøve og derfor kobles hver respondent i stikprøven med gennemsnitlige betalte indkomstskat i respondentens kommune. N Valid 1000 Missing 0 Mean 24663,22 Std. Deviation 4217,970 Med dette udgangspunkt kan vi udregne den gennemsnitlige indkomstskat i landet med et 95%-konfidensinterval. Konfidensintervallet for gennemsnittet er defineret som Y ± z ˆ ˆ, hvor Y = 24663 z 1,96 Side 16 af 39

ˆ Y s = n 4218,0 = 133,38 1000 Det betyder altså, at konfidensintervallet skal findes som: 24663 ± 1,96 133,38 eller 24663 ± 261, 43 eller blot (24401, 24925) Vi kan med andre ord generalisere fra vores stikprøve, så landets gennemsnit af betalt indkomstskat per indbygger ligger mellem 24.401 kroner og 24.925 kroner. Den kritiske antagelse i denne model er, at variablen er normalfordelt, hvilket kan betvivles ved at kigge på fordelingen i forhold til en normalfordelingskurve: (I dette tilfælde er vi i besiddelse af de mere detaljerede nøgletal for kommunerne, så vi kan udregne den vægtede gennemsnitlige betalte indkomstskat med SPSS til at være 24.593 kr. per indbygger et beløb som ligger inden for det 95%- konfidensinterval, vi udregnede.) Opgave 6 (Ved Steffen Tiedemann Christensen) Side 17 af 39

Vægtet gennemsnit af betalt indkomstskat: Kommunerne i datasættet med nøgletal har naturligvis ikke det samme indbyggertal, hvorfor et gennemsnit af hver kommunes gennemsnitlige betalte indkomstskat per indbygger vil være misvisende et gennemsnit må vægtes for at vise den gennemsnitlige indkomstskat for alle indbyggere i alle kommunerne. For at vægte gennemsnittet, kan vi kode en ny variabel ( Kommunens samlede indkomstskat ), som udtrykker samlet indkomst i kommunen: Samlet indkomstskat i kommunen: var62 * var2 Herefter findes vi summen af hhv. Indbyggertal (var2) og vores nye variabel, Samlet indkomstskat i kommunen. SPSS fortæller os dette: N Sum Indbyggertal 1. januar 275 5368248 Samlet indkomstskat i kommunen 275 132022889247,01 Valid N (listwise) 275 Herefter er den vægtede gennemsnitlige indkomst let at finde som: (132.022.889.247/5.368.248) = 24.593 kr./indbygger Dette kan naturligvis gøres lettere ved blot at lade SPSS vægte gennemsnittet af variablen for indkomstskat og derefter lade programmet udregne gennemsnittet. N Mean Std. Deviation Indtægter fra indkomstskat pr. indb. 5368248 24593,29 4379,954 Valid N (listwise) 5368248 Afviger betalt indkomstskat i kommuner med mange statsborgere signifikant det den gennemsnitlige betalte indkomstskat i spørgeskemaundersøgelsen? For at afgøre, om der findes en signifikant afvigelse hér, må vi kende: Side 18 af 39

- Den gennemsnitlige indkomstskat blandt respondenter. - Standardafvigelsen af gennemsnitlig indkomstskat. - Antallet af respondenter. - Den gennemsnitlige indkomstskat blandt respondenter, der bor i kommuner med et højt antal af statsborgere fra 3. lande. (Identificeret ved værdien 2 i variablen fra Opgave 4.) Desværre har vi ingen data for hver respondent betaler i indkomstskat, så vi er nødsaget til at benytte den gennemsnitlige indkomstskat i hjemkommunen fra de kommunale nøgletal. Værdierne finder vi nu ved at lave et udtræk fra SPSS nu altså med udgangspunkt i de flettede svardata Først data fra alle respondenter: Descriptive Statistics N Mean Std. Deviation Indtægter fra indkomstskat pr. indb. 1000 24663,22 4217,970 Valid N (listwise) 1000 For den sidste at finde den sidste værdi, vælger vi kun respondenter, hvor AndelStatsborgereFra3Lande2 = 2 Descriptive Statistics N Indtægter fra indkomstskat pr. indb. Statistic Statistic 165 24115,92 Valid N (listwise) 165 Udgangspunktet er altså nu: - Y = 24663 - s = 4218 Side 19 af 39

- n = 1000 - μ h = 24116 Tallene hér viser altså, at den gennemsnitlige betalte indkomstskat blandt respondenter med et højt antal af statsborgere fra 3. lande (baseret på gennemsnittet i kommunen) er omkring 550 kr. lavere end landsgennemsnittet. Spørgsmålet er nu, om dette kan betragtes som en signifikant afvigelse. Antagelsen for denne signifikanstest er, at sampling-distributionen omkring Y er tilnærmelsesvist normal, da n = 165 > 30. Nul-hypotese: H 0 : μ = Y = 24663 Alternativ hypotese: H A : μ 24663 Teststatistik: z = Y μ 24663,29 24116 = = 4,10 s/ n 4218 / 1000 Denne z-værdi udtrykker, at den gennemsnitlige indkomstskat i kommuner med et højt antal statsborgere fra 3. lande falder omkring 4 standard errors fra stikprøvens middelværdi. P-værdi: Med den givne z-værdi kan vi udregne en P-værdi, som udtrykker sandsynligheden for at den fundne z-værdi, hvis nul-hypotesen er korrekt eller blot sandsynligheden for at nul-hypotesen stemmer givet vores observationer: P = 2*0,0000317 = 0,0000634 Konklusion: En P-værdi på 0,05 udtrykker 95% sikkerhed for at nul-hypotesen ikke stemmer. En så lav P-værdi som denne viser, at vi med næsten 100% sikkerhed kan forkaste nulhypotesen og acceptere den alternative hypotese. Det betyder altså, at der er en Side 20 af 39

signifikant sammenhæng i vores stikprøve mellem antallet af statsborgere fra 3. lande og den gennemsnitlige indkomstskat i kommunen. Opgave 7 (Ved Marie Hammer) For at teste, om der er sammenhæng mellem, om respondenternes indkomstskat og om hvorvidt de anser indvandring som en trussel mod den nationale egenart, inddeler vi dem i to grupper én (gruppe 1) som er helt eller delvist uenig, og én (gruppe 2), som modsat er helt eller delvist enig. Og vi har brug for data omkring deres indkomstskat igen er vi nødt til at anvende data, som stammer fra de kommunale nøgletal, så hver respondent kobles med sin kommunes gennemsnitlige betalte indkomstskat. Gruppe 1: Helt eller delvist uenige I at indvandring udgør en alvorlig trussel mod vores nationale egenart. N Mean Std. Deviation Indtægter fra indkomstskat pr. indb. 513 25137,73 4481,742 Valid N (listwise) 513 Gruppe 2: Helt eller delvist enige I at indvandring udgør en alvorligtrussel mod vores nationale egenart. N Mean Std. Deviation Indtægter fra indkomstskat pr. indb. 361 24160,68 4022,664 Valid N (listwise) 361 Vi ved altså, at: - μ 1 = 25138 - n 1 = 513 - s 1 = 4482... samt at: - μ 2 = 24161 - n 2 = 361 - s 2 = 4023 Side 21 af 39

Nul-hypotese: H 0 : μ 1 = μ 2 eller μ 2 μ 1 = 0 Alternativ hypotese: H A : μ 1 μ 2 Teststatistik: Her afvender vi, at den estimerede værdi af μ 2 μ 1 er Y 2 Y 1 ( Y z = 2 Y1 ) 0 ˆ Y2 Y1 = Y 2 2 s1 n1 Y + 1 2 s2 n2 = μ μ 2 2 s1 n1 + 1 2 s2 n2 = 24161 25138 = 2 2 4482 4023 + 513 361 977 = 3,37 289,81 P-værdi & Konklusion: Dette er en relativt høj z-værdi som dermed svarer til en lav P-værd, omkring 2*0,000233=0.00466. Derfor kan vi igen sige med næsten 100% sikkerhed, at der er tale om en signifikant afvigelse. Det betyder, at vi kan afvise nul-hypotesen, der siger, at der ingen sammenhæng er mellem perceptionen af en trussel og den gennemsnitlige indkomstskat i kommunen. Konklusionen bliver altså, at der er en sammenhæng. Opgave 8 (Ved Steffen Tiedemann Christensen) For at undersøge sammenhængen mellem opfattelsen af indvandring som en alvorlig trussel og den tidligere oprettede variabel, der måler antallet af statsborger fra 3. lande i hver kommune i kategorierne lav, middel og høj, laver vi en Cross-tab i SPSS. I rå data bliver udfaldet således: Andel Statsborgere Fra 3.-lande, 2 Total Lav Middel Høj INDVAND. Helt uenig Count 117 167 79 363 ALVORL. Expected Count 143,4 159,9 59,8 363,0 TRUSSEL Adjusted Residual -3,6,9 3,4 Side 22 af 39

Delvis uenig Count 47 76 27 150 Expected Count 59,2 66,1 24,7 150,0 Adjusted Residual -2,2 1,8,6 Hverken enig eller uenig Count 53 52 11 116 Expected Count 45,8 51,1 19,1 116,0 Adjusted Residual 1,5,2-2,2 Delvis enig Count 61 63 17 141 Expected Count 55,7 62,1 23,2 141,0 Adjusted Residual 1,0,2-1,5 Helt enig Count 113 78 29 220 Expected Count 86,9 96,9 36,2 220,0 Adjusted Residual 4,1-2,9-1,5 Total Count 391 436 163 990 (Læg mærke til at svarkategorien Ved ikke er udelukket fra vores datasæt dette vil fortsætte med at være tilfældet i delopgaverne 9 og 10. For det første betyder udelukkelsen af de 10 Ved ikke -respondenter, at trusselsvariablen bliver ordinal, hvilket muliggør en gammatest på vores data i denne opgave. Samtidig betyder det dog også mindre støj på målingen af sammenhænge, hvilket giver et bedre billede i chi-square tests.) Her kan vi se, at der eksempelvis er 117 ud af 391 respondenter fra kommuner med et lavt antal statsborgere fra 3.-lande, der har svaret, at man er uenige i indvandring udgør en alvorlig trussel. Tilsvarende kommer 78 ud af 220 respondenter, der er helt enige i truslen, fra kommuner med middel-mange statsborgere fra 3.-lande. Det vil sige, at kun godt 35% af i Helt enig -kategorien kommer fra Middel - kommuner mens hele 51% modsat kommer fra Lav -kommuner til trods for at der er flere respondenter i stikprøven, der er klassificeret som bosiddende i kommuner med et middelantal af statsborgere fra 3.-lande. Det kunne altså tyde kraftig på, at der er en sammenhæng. Men lad os opstille situationen formelt: Antagelser: To kategorisk inddelte variable, en tilfældig stikprøve og mere end 4 observationer i hver celle. Alle disse antagelser er opfyldte. Vi kan forkaste vores nul-hypotese ved signifikansniveauet (alphaniveauet) 0,05. Side 23 af 39

Nul-hypotese: Alternativ hypotese: H 0 : Variablerne er statistik uafhængige. H A : Variablerne er statistik afhængige. Test-statistik: Er variablerne statistisk uafhængige, vil besvarelserne fordele sig ens i kategorierne fra Helt uenig til Enig lige meget om respondenten bor en kommune med relativt få eller relativt mange statsborgere fra 3.-lande. Omvendt vil variablerne kunne siges at være statistisk uafhængige, hvis fordelingen varierer på en på en måde, som er meget usandsynlig, hvis nul-hypotesen skulle passe. Netop denne sandsynlighed kan udregnes med en chi-square-test, som SPSS udregner således: Chi-Square Tests Value df Asymp. Sig. (2-sided) Pearson Chi-Square 35,328(a) 8,000 N of Valid Cases 990 a 0 cells (,0%) have expected count less than 5. The minimum expected count is 19,10. P-værdi: Med 8 frihedsgrader og en chi-square-værdi på 35, falder P-værdien (sandsynligheden for at nul-hypotesen kan stemme med udgangspunkt i vores stikprøve) ifølge Tabel C i Agresti og Finlay under 0,001 eller som SPSS rapporterer er P-værdien 0,000. Konklusion: Med en P-værdi under 0,05 kan nul-hypotesen afvises med 95% sikkerhed og variablerne kan siges at være statistik afhængige. I dette tilfælde er P-værdien endog betydeligt lavere, så vores nul-hypotesen afvises, og vi konkluderer, at der er en statistisk sammenhæng mellem de to variable. Da begge vores variable i dette tilfælde er ordinale, kan konklusionen understreges med en gammatest på vores data. SPSS fortæller os i dette tilfælde, at: Value Asymp. Std. Approx. T(b) Approx. Sig. Side 24 af 39

Error(a) Ordinal by Ordinal Gamma -,207,040-5,174,000 N of Valid Cases 990 a Not assuming the null hypothesis. b Using the asymptotic standard error assuming the null hypothesis. Altså er gammaværdien -0,207, hvilket viser en negativ om end ikke særligt stærk sammenhæng mellem variablene til trods for udfaldet af testen og konklusionen ovenfor. Det udtrykker i dette tilfælde som vi også kunne se af de standardiserede residualer at der er flere uenige respondenter i kommuner med mange statsborgere fra 3.lande, end man kunne have forventet. Og at der omvendt er flere enig respondenter i kommuner med et lav antal statsborgere fra tredjelande. Opgave 9 (Ved Marie Hammer) Til at starte med, laver vi en simpel kodning af landsdel, så datasættet deles op i Jylland, Hovedstadsområdet og Øerne i øvrigt. Kodningen foretages på baggrund af kommunenummeret: Kommunenummer Landsdel 100-199 Hovedstadsområdet 200-499 Øerne i øvrigt 500-900 Jylland Laver vi den samme krydstabuleringsøvelse som i forrige opgave, ser vi, at: Landsdel Total INDVAND. ALVORL. TRUSSEL Hovedstadsområdet Jylland Øerne i øvrigt Helt uenig Count 102 148 113 363 Expected Count 78,5 167,2 117,3 363,0 Adjusted Residual 3,8-2,5 -,6 Delvis uenig Count 42 66 42 150 Expected Count 32,4 69,1 48,5 150,0 Adjusted Residual 2,1 -,5-1,2 Hverken enig Count 12 59 45 116 eller uenig Expected Count 25,1 53,4 37,5 116,0 Adjusted Residual -3,1 1,1 1,6 Side 25 af 39

Delvis enig Count 24 65 52 141 Expected Count 30,5 64,9 45,6 141,0 Adjusted Residual -1,4,0 1,2 Helt enig Count 34 118 68 220 Expected Count 47,6 101,3 71,1 220,0 Adjusted Residual -2,5 2,6 -,5 Total Count 214 456 320 990 Et hurtigt blik på denne tabel viser, at antal respondenter, der placerer sig i hver celle, afviser betydeligt fra de tilsvarende antal og at fem af de standardiserede residualer numerisk overstiger 2. Alt i alt et tegn på, at de to sammenlignede variabler er statistisk afhængige. For at teste sammenhængen, foretager vi dog en chi-square-test. Antagelser: To kategorisk inddelte variable, en tilfældig stikprøve og mere end 4 observationer i hver celle. Alle disse antagelser er opfyldte. Vi kan forkaste vores nul-hypotesen ved -niveauet 0,05. Nul-hypotese: Alternativ hypotese: Test-statistik: H 0 : Variablerne er statistik uafhængige. H A : Variablerne er statistik afhængige. Value Df Asymp. Sig. (2-sided) Pearson Chi-Square 31,181(a) 8,000 N of Valid Cases 990 a 0 cells (,0%) have expected count less than 5. The minimum expected count is 25,07. P-værdi: Med en chi-square-værdi over 30 og otte frihedsgrader viser tabel C i Agresti og Finlay, at P-værdien ligger under 0,001 og SPSS s udregning giver endda P = 0,000. Konklusion: Men en så høj P-værdi, kan nul-hypotesen afvises, og vi kan understrege, at de to variable er statistisk afhængige. Side 26 af 39

Opgave 10 (Ved Steffen Tiedemann Christensen) Vi gør her brug af den præcist samme fremgangsmåde som i de to forrige opgaver først laver vi en krydstabulering af de to variable i SPSS for siden at opstille model, hypoteser, test-statistik, P-værdi og til sidst en konklusion på spørgsmålet. Krydstabulering: RESPONDENTENS KØN Total Mand Kvinde INDVAND. Helt uenig Count 162 201 363 ALVORL. Expected Count 173,8 189,2 363,0 TRUSSEL Adjusted Residual -1,6 1,6 Delvis uenig Count 82 68 150 Expected Count 71,8 78,2 150,0 Adjusted Residual 1,8-1,8 Hverken enig Count 57 59 116 eller uenig Expected Count 55,5 60,5 116,0 Adjusted Residual,3 -,3 Delvis enig Count 66 75 141 Expected Count 67,5 73,5 141,0 Adjusted Residual -,3,3 Helt enig Count 107 113 220 Expected Count 105,3 114,7 220,0 Adjusted Residual,3 -,3 Total Count 474 516 990 Som i forrige opgave finder vi ingen standardiserede residualer, der numerisk overstiger 2, så vi vil ikke forvente at se en sikker statistisk sammenhæng meller de to variable men residualerne er dog i nogle tilfælde højere end i den forrige tabel. Residualerne i Helt uenig og Delvis uenig er modsat rettede mellem mænd og kvinder så måske er kvinder mere tilbøjelige til at svare, at man er kategorisk uenige end mænd? Antagelser: Side 27 af 39

To kategorisk inddelte variable, en tilfældig stikprøve og mere end 4 observationer i hver celle. Antagelserne er opfyldte. Vi kan forkaste vores nul-hypotesen ved - niveauet 0,05. Nul-hypotese: H 0 : Variablerne er statistik uafhængige. Alternativ hypotese: H A : Variablerne er statistik afhængige. Test-statistik & P-værdi: Value Df Asymp. Sig. (2-sided) Pearson Chi-Square 4,496 4,343 N of Valid Cases 990 Konklusion: Da P = 0.343 > 0,05, kan nul-hypotesen ikke forkastes, og vi kan ikke afvise, at trusselsopfattelsen er statistisk uafhængig af respondentens køn. Opgave 11 (Ved Marie Hammer) Da der her ønskes en test af hvorvidt stikprøven er repræsentativ mht. køn ses på andelen af kvinder i stikprøven, som sammenlignes med vores formodede værdi. Via statistikbankens data fra 2002 findes andelen af kvinder i populationen, som her er den formodede værdi. Af data i statistikbanken er benyttet population over 16år, da stikprøven vedrører folk i aldersgruppen 16-90år. Antagelserne for en binomialtest er følgende (Agresti og Finlay, 1997:188): At variablerne er binære, altså inddelt i to grupper. Sandsynligheden for kategorierne er den samme for hver observation. Observationerne er uafhængige At stikprøvens størrelse er større end 30, dvs. n 30. Side 28 af 39

Til vurderingen af stikprøvens repræsentativitet gennemføres igen en binomialtest, da stikprøven opfylder alle krav til dette. P(x) = n! x!(n x)! x (1 n x ) I formlen (Agresti og Finlay, 1997:189) er x lig mulige resultater og er andelen af kvinder fra populationen taget fra statistikbanken. Andel af kvinder i stikprøven: Kvinder Mænd Antal 526 474 Total 1000 1000 Andel 0,526 0,474 Andelen af kvinder i populationen: Kvinder Mænd Antal 2.196.098 2.108.358 Total 4.304.456 4.304.456 Andel 0,51 0,49 Ud fra ovenstående data fra statistikbanken opstilles følgende hypoteser: Nul-hypotese: H 0 : = 0,51 Alternativ hypotese: H a : 0,51 Vi benytter SPSS til at foretage en binomialtest: Side 29 af 39

RESPONDE Gro Gro Tot N Kvin 526,53,51 Mand 474,47 10 1,0 Asymp a a. B Konklusion: Vores binomialtest viser os at der er tale om en toleddet signifikansniveau på 0,326. Dette betyder at H o ikke kan afvises, dog kan vi heller ikke acceptere denne, da sandsynligheden for at H o er gældende er 32,6 %, hvilket overstiger alfagrænsen på 0,05. Konklusionen er således, at stikprøven er repræsentativt mht køn. Opgave 12 (Ved Steffen Tiedemann Christensen) I SPSS estimeres andelene der er helt eller delvis enige i henholdsvis Ulandshjælpen er vigtig, fordi den er med til at mindske flygtningestrømmen fra ulandene og Ulandshjælpen er vigtig, fordi det også er i Danmarks interesse at bekæmpe AIDS og andre smitsomme sygdomme i de fattige lande. Dette har vi gjort ved at omkode værdierne helt enig og delvis enig til en samlet variabel og alle andre værdier til en anden samlet. Nedenstående tabeller viser resultaterne. Vali andr enig Tota 369 36,9 36,9 631 63,1 63,1 10 0 Vali andr enig Tota 193 19,3 19,3 19,3 807 80,7 80,7 0 10 Side 30 af 39

For at sammenligne de to andele, udføres en signifikanstest efterfulgt af et konfidensinterval, der fortæller os hvorvidt andelene afviger signifikant fra hinanden. Vi kalder variablen flygtningestrømme for andel 1 og variablen smitsomme sygdomme for andel 2. For alle formler henvises til Agreti og Finlay side 219. 1. Modelantagelser: 1000 respondenter valgt ved simpel tilfældig indsamling Populationen er borgere i Danmark over 16 år. Data er kvalitativt og kvantitativ; det kvalitative er omkodet til kvantitativt Eftersom stikprøven er større end 30 og dermed opfylder kravene til den centrale grænseteori, kan vi bruge en z-værdi til at finde P, jo mindre P er des mere modsiger data H 0. Vi vælger en signifikansniveau på 95 % og en signifikansværdi på = 0,05 2. H 0 : 1 = 2 H a : 1. 2 3. Test: z = ˆ ˆ 0 2 1 ˆ ˆ ˆ 2 ˆ 1 = ˆ ˆ 2 ˆ 1 = ˆ 2 ˆ 1 ˆ 1 (1 ˆ 1 ) + ˆ (1 ˆ ) 2 2 n 1 ˆ ˆ 2 ˆ 1 = 0,01971 n 2 0,807 (0,193 ) 0,631 (0,369 ) + 1000 1000 0,807 0,631 0 z = 0,01971 z = 8,93 4. H 0 afvises da vi har en z-værdi på 8,93 og en P-værdi på 0,000, og der er således en signifikant forskel på de to andele. Da vi nu har fastsat at der er en signifikant forskel på de to andele, kan forskellen præciseres ved hjælp af et konfidensinterval. Med konfidensintervallet kan vi beskrive indenfor hvilket interval forskellen ligger. Her opstiller et 95 % konfidensinterval. Side 31 af 39

( ˆ 2 ˆ 1 ) ± z ˆ 1 (1 ˆ 1 ) + ˆ (1 ˆ ) 2 2 n 1 n 2 (0,631 0,807 ) ±1,96 0,807(0,193 ) 1000 (0,631 0,807 ) ±1,96 0,01971 + 0,631(0,369 ) 1000 Vores konfidensinterval ligger på [-0,215;-0,137]. Der er en forskel på de to variabler mellem 0,137 og 0,215, idet konfidensintervallet ikke indeholder 0. Dette kan siges med 95 % sikkerhed. Vurdering og perspektivering Da de to spørgsmål er forskellige omkring begrundelsen for at ulandhjælp er vigtig, er der intet, der logisk binder de to spørgsmål sammen. Det er både muligt at svare ja til det ene og nej til det andet spørgsmål, ligeså vel som ja eller nej til begge er en mulighed. En anden meget normativ måde at forklare forskellen er ved at inddele spørgsmålene i egoistiske eller altruistiske holdninger. Således kan der argumenteres for, at mindskelse af flygtningestrømme som argument for ulandshjælp er udtryk for en mere egoistiskholdning end argumentet omkring bekæmpelse af AIDS og andre smitsomme sygdomme. At argumentet omkring flygtningestrømme er udtryk for en mere egoistisk holdning end bekæmpelsen af smitsomme sygdomme, skal ses ud fra at truslen i højere grad er af indenrigspolitisk karakter. Et problem ved en sådan normativ forklaringsmodel er dog at der, som altid med spørgeskema, kan stilles spørgsmålstegn ved om alle respondenter forstår spørgsmålet på den tiltænkte måde. Eks. spredningen af demokrati både være udtryk for en egoistisk holdning, hvis man mener, det vil mindske terrortruslen. Samtidig kan det være udtryk for et mere humanitært ønske om at skabe mere demokratiske forhold for verdens befolkning. Man må således altid forholde sig kritisk til undersøgelsesmaterialet bag vores empiriske konklusioner. For at perspektivere til spørgsmålene vedr. begrundelse for at give ulandshjælp er variabel 27 til 35 indsat i en tabel med tilhørende frekvensværdier: Side 32 af 39

Variabel hvorfor Procent helt enig + delvist ulandshjælp er vigtig enig Medansvar for at bekæmpe 75,4 % fattigdom Mindske ufred og krig pga. øget 66,0 % levestandard Hjælpe med at sprede demokrati 64,2 % Løse globale miljøproblemer 61,0 % Mindske flygtningestrømme 63,1 % Bekæmpe AIDS 80,7 % Bidrage til at skabe jobs i 42,6 % danske virksomheder Bøde på fattigdom skabt via 51,6 % rige landes told Opbakning til FN og FNs 58,9 % samarbejde Det er meget svært, at vurdere hvorvidt frekvenstabellen er overraskende eller som forventet, da dette kræver et forudindtaget kendskab, som vi ikke har. Det kan dog siges, at vi i udgangspunktet ikke er overrasket over, at de mere humanistiske argumenter som Medansvar for at bekæmpe fattigdom ligger på et relativt højt niveau, idet Danmark primært har begrundet ulandshjælp ud fra en humanistisk forpligtelse. Igen må man forholde sig kritiks til respondenternes valg, idet man ofte har en tendens til at vægte politisk korrekte holdninger, når man bliver spurgt direkte og går uden om mere egoistiske argumenter som Bidrage til at skabe jobs i danske virksomheder. Opgave 13 (Ved Marie Hammer) ALDER I undersøgelsen af hvorvidt stikprøven er repræsentativ mht. alder ønskes stilprøvens repræsentation af aldersgrupper sammenlignet med tal fra populationen fundet på Statistikbanken. Først orienteres der i dokumentationsdokumentet om, at stikprøven Side 33 af 39

omhandler respondenter i aldersgruppen fra 16-90 år, så samme aldersgruppe er hentet fra statistikbanken. Ydermere orienterer dokumentationsdokumentet om, at aldersgruppen 16-24år er underrepræsenteret. Ud fra dette er der valgt et aldersinterval for hver gruppe på cirka 9. Således fås 8 kategorier. Nedenstående tabel viser antal og andel for hver af disse. Population Alder Antal Andel 16-24 539823,00 0,126129492 25-33 684252,00 0,159875287 34-42 738930,00 0,172650786 43-51 662693,00 0,154838033 52-60 669249,00 0,15636984 61-69 438748,00 0,102513347 70-78 325410,00 0,076031955 79 + 220806,00 0,05159126 I alt 4279911,00 1 Således kan vi nu undersøges differensen mellem den forventede og den observerede andel. Den forventede værdi er her vores data fra statistikbanken og den observerede vores data fra stikprøven. Differensen undersøges for hver af de 8 aldersinddelinger. I notat til opgaveudleveringen findes nedenstående formel. Bemærk at Q værdien, den samlede teststørrelsen, er approksimativt Chi 2 fordelt, når den forventede værdi for alle celler er større end 3. At dette er tilfældet ses ud fra ovenstående tabel. Vores q værdi for hver alderskategori udregnes med formlen fra notatet. Der opstilles to hypoteser: Nul-hypotese: H 0 : Stikprøvens andele = populationens andele Alternativ hypotese: H a : Stikprøvens andele populationens andele Signifikansniveau fastsættes til = 0,05. Regneeksempel for aldersgruppen 16-24 år. Side 34 af 39

Q = k i=1 (X 1 n p i0 ) 2 n p i0 K.U. 29-03-2006 Metode Skriveøvelse 1 (82 126,129)2 q = 126,129 q =15,44 Nedenstående tabel viser den observerede værdi, dvs. antallet i hver kategori i stikprøven, den forventede værdi, dvs. andelen i populationen gange n, og q samt summen af de fire q = Q. Alder Observeret værdi Forventet værdi q 16-24 82 126,1294919 15,43978359 25-33 162 159,8752871 0,028237039 34-42 186 172,6507864 1,032149964 43-51 180 154,8380328 4,088947524 52-60 180 156,3698404 3,570921613 61-69 112 102,5133467 0,877901216 70-78 74 76,03195487 0,054304017 79-90 24 51,59125972 14,75594155 I alt 1000 1000 Q 39,84818651 Q udregnes til at være lig 39,85. Q svarer til en Chi 2 fordeling med 7 frihedsgrader så vi slår Q-værdien op i tabel C (Agresti og Finlay, 1997:670), for at finde vores P værdi. Efter dette afvises vores H 0, idet P er under 0,001, og ligger dermed under = 0,05. Dermed kan vi konkludere, at stikprøven ikke er repræsentativ mht. alder. Mere præcis hvilke aldersgrupper, hvis ikke alle, der er dårligt repræsenteret i stilprøven, ses ud fra vores tabel. Som nævnt i dokumentationsdokumentet er aldersgruppen 16-24år underrepræsenteret og dette bekræfter vores undersøgelse, hvor der i stilprøven kun er en andel på 82, mens der i populationen er en andel på 126,13. Ligeledes er aldersgruppen 79-90 stærkt underrepræsenteret, da stilprøvens andel ligger på 24 overfor 51,59 i populationen. De resterende aldersgrupper er alle en smule overrepræsenteret, men der er særligt i den unge og i den ældre ende, man må forholde sig kritisk til stikprøvens generaliserbarhed. Side 35 af 39

Politik K.U. 29-03-2006 Metode Skriveøvelse 1 Samme formel benyttes til at undersøge hvorvidt stilprøven er repræsentativ mth. politik. Forventet værdi er her data fra Indenrigsministeriets hjemmeside 1. Parti Observeret værdi Forventet værdi Q Socialdemokratiet 268 255,4382391 0,61775339 Radikale 52 45,57786463 0,904909063 Konservative 66 79,62881149 2,332629348 CD 10 15,53801833 1,973845467 SF 103 55,97006483 39,51781742 DF 62 105,3978731 17,86919733 Kristeligt Folkeparti 28 20,06008551 3,142670661 Venstre 262 274,4142709 0,561611174 Fremskridtspartiet 5 4,92381371 0,001178832 Enhedslisten 22 21,05095846 0,042785693 I alt 878 878 66,96439837 Igen opstilles to hypoteser: Nul-hypotese: H 0 : Stikprøvens andele = populationens andele Alternativ hypotese: H a : Stikprøvens andele populationens andele Testen udføres med et signifikansniveau på = 0,05. Igen benyttes formlen fra notatet. Resultaterne ses i nedenstående tabel. Parti Observeret værdi Forventet værdi Q Socialdemokratiet 268 255,4382391 0,61775339 Radikale 52 45,57786463 0,904909063 Konservative 66 79,62881149 2,332629348 1 For sammenligningens skyld fjernes kategorierne 13,14, 15 og 16. Disse omhandler folk, der nægter at svare, ikke har stemmeret, ved ikke og stemte blank. Kategorien Andet parti er ligeledes fjernet fra stikprøven, kategorien Udenfor partierne fra Indenrigsministeriets tal og Demokratisk Fornyelse fra stikprøven, da denne kategori ikke kan forefindes i Indenrigsministeriets tal. Side 36 af 39

CD 10 15,53801833 1,973845467 SF 103 55,97006483 39,51781742 DF 62 105,3978731 17,86919733 Kristeligt Folkeparti 28 20,06008551 3,142670661 Venstre 262 274,4142709 0,561611174 Fremskridtspartiet 5 4,92381371 0,001178832 Enhedslisten 22 21,05095846 0,042785693 I alt 878 878 66,96439837 Det ses, at Q er lig 66,96. Derefter slås vores P-værdi op i tabel C (Agresti og Finlay,1997:670), idet Q svarer til en Chi 2 fordeling med 9 frihedsgrader. P opslås til at være under 0,001 - dermed under = 0,05. Dette betyder, at vores H 0 hypotese kan afvises. Kort sagt, stikprøven er ikke repræsentativ mht. politisk ståsted. I Dokumentationsdokumentet står, at DF vælgere for sidste valg er underrepræsentation i stikprøven, så denne uoverensstemmelse var forventet. Om der ellers er partitilhørsforhold, der skaber den dårlige repræsentation, ses ved at kikke nærmere på tabellen. Det ses, at også SF s repræsentation i stikprøven afviger fra den forventede, men modsat DF er SF stærkt overrepræsenteret i stikprøven. CD er underrepræsenteret i stikprøven, men ellers er der nogenlunde overensstemmelse mellem de forventede og de observerede værdier for de resterende partier. Resultatet er dog stadig at stikprøven ikke er repræsentativ. Overvejelse og diskussion: For at kunne forholde sig kritisk til undersøgelsesmaterialet, her stikprøven på 1000 respondenter, er vores test af materialets repræsentativitet, en vigtig bestanddel. Dette er gjort mht. køn, alder og politisk ståsted. Hvad angår køn konkluderede vi, at stikprøven er repræsentativ, så denne variabel har ingen negative konsekvenser for de empiriske resultaters generaliserbarhed. Mht. aldersrepræsentationen konkluderede vi, at stikprøven ikke var repræsentativ. Dette gjaldt særligt for aldersgruppen 16-24 og 79-90. I opgave 2 opstillede vi den forforståelse for aldersgruppen 67+, at de givetvis var mere kritiske overfor indvandring end yngre generationer. Hvis dette holder viser stikprøven muligvis en mere positiv holdning til indvandring, end der findes i populationen. Til gengæld må vores forforståelse for aldersgruppen 16-14år være lige omvendt, så muligvis Side 37 af 39

udligner den manglende repræsentation af unge med positiv holdning til indvandring, underrepræsentationen af de mere negative ændre. Med hensyn til politisk repræsentativitet, konkluderede vi, at der var en underrepræsentation af DF vælgere og en overrepræsentation af SF vælgere. Dette kunne skyldes, at SF vælgere i højere grad interesserer sig for og har en markant holdning til ulandsbistand og miljøbistand og derfor er mere tilbøjelige til at ville svare på spørgsmål vedr. disse emner. Dette kan have den uheldige konsekvens for undersøgelsen af den overordnede problemstilling, at stikprøven viser en større opbakning til ulandshjælp, end der reelt er til stede i populationen. Ligeledes kan det tænkes at DF vælgere har en mere negativ opfattelse af indvandrere end vælgere af de resterende partier og derved viser stikprøven en mindre negativ holdning til indvandring, end der er til stede i populationen grundet deres underrepræsentation. Der er dog ingen tvivl om, at alle disse gætterier omkring stikprøvens analytiske generaliserbarhed, bør undgås ved at tilstræbe en repræsentativ fordeling af aldersgrupper, køn, politisk ståsted mv. i stilprøven. Al form for skæv repræsentation mindsker korrektheden, når vi tester vores hypoteser på det empiriske materiale. Side 38 af 39

Litteraturliste Agresti, Alan & Barbara Finlay (1997): Statistical Methods for the Social Sciences. Third Edition. New Jersey: Prentice-Hall. Side 39 af 39