Regressionsanalyse i SurveyBanken

Relaterede dokumenter
Lav etiketter online. Hvorfor? Før du går i gang. Hvordan

Statistik i GeoGebra

SPSS introduktion Om at komme igang 1

MAT A HHX FACITLISTE TIL KAPITEL 8. Øvelser. Øvelse 1 Graf tegnes med CAS. Øvelse 2. Bedste rette linie: Øvelse 3. Øvelse 4.

Bilag 12 Regressionsanalysens tabeller og forklaringer

Indhold Registrering på forum... 2 Opret Indlæg... 5 Besvar Indlæg... 7 Ændringer af brugerindstillinger... 9 Tips & Tricks... 11

Conventus og SFGIF Hvordan opretter jeg en ny træner?

MENTIMETER GUIDE TIL MENTIMETER 1. +New event

En liste, hvor der kun kan angives et svar. En dropdown menu, hvori kun et svar kan vælges

Samfundsfag og matematik

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

Vejledning til ansøgning om tid mm i Foreningsportalen

Helt overordnet er der to skridt i udvælgelsen af sammenlignelige kommuner:

Lectio. Spørgeskema. 1. udgave august 2007 OD

Brugermanual SÅDAN GØR DU:

Citation for published version (APA): Dejgaard, T. E. (2011). Forberedelsesmateriale til kursus i surveybank.aau.dk

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Denne Introduktion til ScanPas er en generel brugermanual til Aalborg Universitets personaleadministrative system - ScanPas.

Brugervejledning til Højkvalitetsdokumentationen og Dialogforummet på Danmarks Statistiks hjemmeside

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Guide til madordning. Indhold. 1. Log ind på din konto Bestil mad til dit barn...4

Besvarelse af juul2 -opgaven

Brugerhåndtering i WebUntis - 1

EVALUERING I SURVEYXACT TRIN FOR TRIN

EVALUERING I SURVEYXACT TRIN FOR TRIN

Skriftlig eksamen i samfundsfag

ViKoSys. Virksomheds Kontakt System

Skriftlig Eksamen ST501: Science Statistik Tirsdag den 8. juni 2010 kl

Multipel Lineær Regression

Introduktion. I denne vejledning 1 finder du nogle af de muligheder, Elevintra har. Flere følger senere. Login

Nye funktioner i Professionel Hjernetræning.

MailMax / Web v4.1. Brugsvejledning til webmail. Copyright 2003 Gullestrup.net

Om at finde bedste rette linie med Excel

Stolpediagrammer for kategoriske data med -catplot-

Basal Statistik - SPSS

Kirketælling. Indberet antal deltagere. vejledning FOLKEKIRKENS IT

Vejledning til BUF Akademis administrationssystem for ledere

Bliv KampKlar med Aalborg Chang

ExtraNet. Sider beskyttet med kodeord i OLO

DANSK SKOLEDATA APS. Tlf DSA-Ventelisten

Viditronic NDVR Quick Guide. Ver. 2.0

IntoWords Cloud Tjekliste

Introduktion til SPSS

Vejledning til sms-afstemningssystem

Statistik og skalavalidering. Opgave 1

LOGIN ENDOMONDO. Kære Løber! Denne lille instruktion viser hvordan man redigere:

Øvelse i SurveyBanken: Traditionelle værdier

Kursistvejledning til LUDUS Web

Quick Guide til RKKP-dokumentation.dk. - Find rundt i databasernes dokumentation i online systemet på RKKP-Dokumentation.dk

Graph brugermanual til matematik C

konsultation Patientinformation

Manual til ansøgning om Lokaletilskud i Assens Kommunes tilskudsportal

Vejledning Uniconta. 1 Indhold. 7. oktober finsit Vejledning

Kom godt i gang med I-bogen

Indhold Outlook Web App... 1

Brugervejledning Joomla

Vejledning Tilmelding til ny sæson

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

It-vejledning. 1. Installation på pc med Windows 7 og Internet Explorer. Indhold

Quick Guide Ditmer edagsorden Oktober 2013

Vejledning til registrering som bruger til EudraCT results

Basal Statistik - SPSS

Indholdsfortegnelse. Indhold

TESTPORTAL: BRUGERVEJLEDNING LOG IND ADGANGSKODE

For at påbegynde administration af brugere, skal du på ind på websiden

Vejledning i.

Vejledning til WordMat på Mac

Herning Bibliotekernes Helpdesk

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje.

Vejledning til BUF Akademis administrationssystem for ledere

Kursistvejledning til Ludus Web

Brugervejledning til AIM spørgeskemaer

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Linket viser jer frem til billedet nedenfor, her skal du blot skrive jeres brugernavn og adgangskode. Indtast din adgangskode her:

Hvordan du opretter, bruger og tildeler kategorier til arrangementer og nyheder

Spørgeskemaundersøgelser og databehandling


Introduktion til Playmapping

Vejledning til Autodesk Account - Autodesk Collection og Autodesk AutoCAD Toolset

SecureAware Compliance Analysis Manual

eportfolio på Studienet

Transkript:

Først vælges datasættet De Kommunale Nøgletal. Klik på Variable Description og derefter De Kommunale Nøgletal 2010. De enkelte variable i datasættet bliver nu oplistet og kan vælges. Klik herefter på Analysis og Regression i bjælken øverst i skærmbilledet. Regressionsanalyse i SurveyBanken Morten Højmose Andersen, Aalborg Universitet Denne guide viser, hvordan det i SurveyBanken er muligt at lave regressionsanalyse med både én og flere uafhængige variable. Guiden tager udgangspunkt i to eksempler og kræver et forudgående kendskab til regressionsanalyse. I det første eksempel gøres brug af et datasæt med kommunale nøgletal, som er specielt velegnet til regressionsanalyse. I det andet eksempel gøres brug af en survey (spørgeskemaundersøgelse) og det vises hvordan det her kan være nødvendigt at foretage mindre rekodninger inden regressionsanalysen kan laves. Hvis ikke du er bekendt med SurveyBanken og dens opbygning kan det være en fordel først at læse guiden Godt i gang med SurveyBanken. Regressionsanalyse med kommunale nøgletal I SurveyBanken ligger et datasæt med kommunale nøgletal fra 2010. Det er altså ikke en survey, hvor en stor gruppe mennesker er adspurgt om deres holdninger, men et datasæt med faktuelle tal om de danske kommuner, som netop er velegnet til brug af regressionsanalyser. Regressionsanalyse kræver, at alle mål skal være kontinuerte og dette gælder for alle variable i datasættet De Kommunale Nøgletal. I denne guide tages udgangspunk i tre udvalgte variable. Disse er Andel 25-64 årige med videregående uddannelse, Anmeldte tyverier/indbrud pr. 1.000 indbyggere og Befolkningsandel i bymæssig bebyggelse. I første omgang vælger vi Andel 25-64 årige med videregående uddannelse som vores uafhængige variabel og Anmeldte tyverier/indbrud pr. 1.000 indbyggere som vores afhængige variabel. Andel 25-64-årige med videregående uddannelse (uafhængig variabel) Anmeldte tyverier/indbrud pr. 1.000 indbyggere (afhængig variabel) 1

Klik på variablen Anmeldte tyverier/indbrud pr. 1.000 indb. og klik herefter på Add as dependent variable. Herved får vi en afhængig variabel, som udtrykker antallet af tyverier/indbrud og vi vælger herefter vores uafhængige variabel. Klik på variablen Andel 25-64-årige med videregående uddannelse og klik på Add as independent variable. Herved tilføjes vores uafhængige variabel til regressionsanalysen. Resultatet viser for det første, at der er en meget lav p-værdi. Dette udtrykkes under Significance, som viser en p-værdi på 0,0086. Dette fortæller, at vi er under det gængse krav om en p-værdi på mindre end 0,05. Vi kan altså på et 0,05 signifikansniveau afvise vores nulhypotese om, at der ikke er en sammenhæng mellem andelen af 25-64-årige med en videregående uddannelse og antallet af tyverier/indbrud. Vi kan derfor også tillade os at fortolke de andre resultater. Regressionskoefficienten kan aflæses som B og viser, at hvis andelen med en videregående uddannelse stiger med ét procent point i en given kommune stiger antallet af anmeldte tyverier pr. 1.000 indbyggere typisk med 0,63. Den standardiserede regressionskoefficient Beta på 0,26 viser, at der er tale om en moderat sammenhæng. Den samlede models forklaringskraft er dog ikke voldsom stor. En Multiple R Squared på 0,07 indikerer, at syv procent af forskellen i anmeldte tyverier/indbrud (per 1.000 indbyggere) kan forklares af forskelle i andel med videregående uddannelse. Vi kan nu se sammenhængen mellem vores uafhængige og afhængige variabel. Det vil sige, at vi kan se, hvordan antallet af højtuddannede i en given kommune påvirker antallet af tyverier/indbrud. 2

Ved at klikke på graf-symbolet i bjælken øverst i skærmbilledet vises et koordinatsystem hvori de enkelte værdier er placeret 1. Umiddelbart er der altså tale om en måske lidt uventet sammenhæng, nemlig at jo større andelen af højtuddannede er i en kommune, des flere anmeldte tyverier/indbrud er der også. Forklaringen findes dog ved at tilføje endnu en uafhængig variabel, nemlig befolkningsandelen i bymæssig bebyggelse. Derved går vi også fra en bivariat til en multipel regressionsanalyse. Klik på variablen Befolkningsandel i bymæssig bebyggelse og klik på Add as independent variable. Herefter foretages analysen med både andelen af højtuddannede og befolkningsandelen i bymæssig bebyggelse som uafhængige variable. For at skifte tilbage til tabellen indeholdende resultaterne fra regressionsanalysen klikkes på tabel-symbolet i bjælken øverst i skærmbilledet. 1 Bemærk venligst, at linjen i grafen ikke stemmer overens med de tal for regressionslinjen som er opgivet i tabellen. Det lader til at være en fejl i den software som SurveyBanken bruger. 3

Regressionsanalyse af surveydata Det ses nu, at vi får forholdsvis lave p-værdier for begge variable. Vi kan derfor for begge variables vedkommende med ret stor sikkerhed afvise nulhypotesen. Resultatet viser også, at antallet af tyverier/indbrud falder, når andelen af højtuddannede stiger. Dette ses ved de nu negative B- og Beta-værdier for denne variabel. Resultatet viser også en langt stærkere forklaringskraft, idet Multiple R Squared er steget fra 0,070 til 0,520. Regressionsanalyse af surveydata foregår efter samme skabelon som det er tilfældet med De Kommunale Nøgletal. Ved regression af surveydata møder man imidlertid ofte det problem, at der udover de ønskede besvarelser eller værdier i de enkelte variable også er værdier for besvarelser som eksempelvis ved ikke. Dette ses eksempelvis i variablen nedenfor fra surveyen Religion ISSP 2008. Forklaringen må altså være, at det ikke er fordi, at det er de højtuddannede der begår tyverierne/indbruddene. I stedet skyldes vores første resultat, at de højtuddannede gerne bor i kommuner med mere bymæssig bebyggelse, hvor der altså er flere indbrud/tyverier pr. indbygger. Sammenhængen er illustreret i nedenstående figur. Andel 25-64-årige med videregående uddannelse (uafhængig variabel) Anmeldte tyverier/indbrud pr. 1.000 indbyggere (afhængig variabel) Befolkningsandel i bymæssig bebyggelse (uafhængig variabel) Variablen angiver på en ordinalskala fra 1-7 respondentens vurdering af, hvor religiøs vedkommendes mor var i barndommen. Derudover antager variablen imidlertid 8 for besvarelsen Ved ikke og 9 for Uoplyst. For at kunne bruge variablen i en regressionsanalyse er det derfor nødvendigt at sikre, at værdierne 8 og 9 ikke tælles med. Dette er allerede tilfældes for værdien 9 Uoplyst, hvilken kan ses ved, at de 41 besvarelser som her er angivet, ikke tælles med i den procentuelle udregning. Yderligere er der under Summary Statistics angivet netop 41 Missing cases. Værdien 8 Ved ikke skal på samme måde, som det allerede er tilfældet for værdien 9 Uoplyst, markeres som en missing case. Dette gøres ved at rekode variablen. 4

Klik på summeringstegnet (Compute). Herefter er det muligt at rekode variablen ved at udfylde skemaet. En frekvenstabel over den valgte variabel kan ses i bunden. I den øverste del indtastes de værdier som ønskes rekodet. Det vil i vores tilfælde være værdien 8 Ved ikke som skal rekodes til at være missing ; altså til ikke at tælle med. Vi bevarer blot værdien 8, men det vigtige er, at vi sætter flueben ud for As missing. Og vælg herefter Recode fra menuen under punktet Create. Da vi blot ønsker de resterende værdier bevaret som de er, vælger vi markeringen Keep as original values under All other values. Ud for Label tildeler vi vores nye og rekodede variabel et navn, i dette tilfælde Relig_mor_rekodet. Klik herefter på variablen Hvor religiøs var din mor, da du var barn? i variabellisten. 5

Herefter klikkes OK. Systemet vil nu spørge efter et brugernavn og en adgangskode. Dette skyldes, at det kræver en personlig profil i SurveyBanken at kunne rekode variable. Du kan se på SurveyBankens forside hvordan du får din egen bruger. Efter du har logget ind, vil variablen kunne findes under User defined variables. På samme måde som ved De Kommunale Nøgletal, kan vores to variable nu indsættes i en regressionsanalyse og resultatet aflæsses og fremkommer identisk hermed. Herefter følges samme procedure for variablen Grad af religiøsitet, som er identisk med vores første variabel, blot med den forskel, at der her er tale om respondentens egen grad af religiøsitet. Resultatet viser, at vi med stor sandsynlighed kan afvise vores nulhypotese om, at der ikke er en sammenhæng mellem de to variable og regressionskoefficienten B viser, at bevæger vi os et trin op på skalaen for hvor religiøs respondentens mor var i barndommen giver det typisk et halvt trin (0,53) på skalaen for religiøs respondenten selv er. 6