At lave dit eget spørgeskema 1 Lectio... 2 2. Spørgeskemaer i Google Docs... 2 3. Anvendelighed af din undersøgelse - målbare variable... 4 Repræsentativitet... 4 Fejlkilder: Målefejl - Systematiske fejl- Fejl i databehandling... 5 Målefejl... 5 Systematiske fejl... 5 Fejl i databehandling... 5 Kausalsammenhænge og skjulte variable... 5 Tredje variable/skjult variabel... 6 Samvariation/gensidig påvirkning... 6 4. Hvor god er din undersøgelse?... 6 1
At lave dit eget spørgeskema Dette afsnit er delt i to. Først en praktisk del omkring hvordan man kan lave spørgeskemaundersøgelser ved brug af Lectio eller GoogleDocs. Den anden del har indledningsvist nogle betragtninger om hvad man skal være opmærksom på når man laver spørgeskemaer i samarbejde mellem matematik og samfundsfag for at få den mest anvendelige data. Samtidig er der nogle betragtninger omkring fejlkilder og kausalsammenhæng som kan læses eller bruges som opslagsværk. 1 Lectio Hvis du bruger Lectio til at foretage spørgeskemaundersøgelsen, har du mulighed for at få datasættet over i Excel, så du kan lave bearbejdningen her. Det kræver kun nogle få tilpasninger. Log ind i Lectio og gå til Forsiden. Her vælges Spørgeskema og et spørgeskema oprettes ved knappen Opret spørgeskema. Spørgeskemaet er nu dukket op under Egne spørgeskemaer og man kan se svarfrist, hvornår det frigives og hvornår det udløber. Når deadline for spørgeskemaet udløber og du skal i gang med bearbejdningen trykker du på Vis og Lectio viser nu en rapportering, hvor du kan se resultaterne i de forskellige spørgsmål. Når du skal have datasættet over i Excel, trykkes blot på knappen Excel Matrix. Der er nu oprettet en fil med respondenterne i søjlen A og spørgsmålene i rækken 1. For at få det lidt pænere kan det være en fordel at gøre overskrifterne fede og låse/fryse den øverste række. Du er nu klar til at bearbejde resultaterne: lave andelstabeller, grafiske fremstillinger, deskriptorer og tests. 2. Spørgeskemaer i Google Docs Hvad nu hvis man vil sende spørgeskemaer til folk udenfor skoleverdenen eller skoler som ikke bruger Lectio? Her er Google Docs en oplagt mulighed. Gå ind på adressen docs.google.com. Opret dig som bruger, hvis du ikke allerede er oprettet. Du har nu nedenstående skærmbillede. 2
Herefter vælges nu: Opret ny og derefter i rullemenuen Formular. Du har nu dette skærmbillede, hvor spørgsmålene kan oprettes. I øverste felt (hvor dummyteksten er Ikke-navngiven formular) indtastes en overskrift for hele spørgeskemaet. I næste boks indtastes en hjælpetekst. Nu kan spørgsmålene oprettes. Google tilbyder her en række forskellige spørgsmålstyper som vist i skemaet. Nederst er vist den adresse, hvor spørgeskemaet (formular) vil blive offentliggjort. Spørgsmålstype Tekst Afsnittekst Multiple choice Afkrydsningsliste Vælg fra en liste Skaler Gitter Beskrivelse Simpelt tekstsvar (en linje) Længere tekstsvar typisk til en uddybende kommentar Udtømmende svarmuligheder Udtømmende svarmuligheder Drop down menu med svarmuligheder Svar muligheder fx fra 1 til 5. Anvendes ved holdningsspørgsmål. Flere udsagn/spørgsmål i klynge med samme svarmulighed Når spørgeskemaet er færdiggjort trykkes på knappen udført. Det er nu oprettet. Nu skal det distribueres, hvilket kan gøres på to måder. Den ene er at maile til de respondenter, som skal besvare spørgeskemaet. I mailen anføres den adresse (link), som er anført nederst i spørgeskemaet (formularen). Den anden mulighed er at offentliggøre spørgeskemaet på ens egen hjemmeside. Der skal da tilføjes en lille stump programkode, som vises ved at klikke på Flere handlinger og derefter Integrer i menuen. Under Flere handlinger er der desuden en valgmulighed mere: Rediger bekræftelse. Her kan man redigere den 3
meddelelse, respondenten får, når det udfyldte spørgeskema er sendt. Her kan man fx skrive noget om, hvor og hvornår resultaterne vil blive offentliggjort. Svarene opsamles automatisk og bliver vist ved i spørgeskemaet at vælge Se svar. Der er to muligheder: enten Oversigtsform eller Regneark. Fra regneark kan resultaterne hentes over i dit værktøjsprogram, hvor bearbejdning af data foregår. 3. Anvendelighed af din undersøgelse - målbare variable Når du formulerer et spørgeskema, som du skal bruge i matematik, er det nødvendigt at du stiller spørgsmål, du kan lave beregninger på. En oplagt mulighed er selvfølgelig spørgsmål med numeriske svar. Hermed har du mulighed for at udregne middelværdi, kvartilsæt osv. Ofte vil man dog i samfundsfag gerne se på andre typer af spørgsmål, og for at muliggøre beregninger kan man hvor det giver mening give svarerne en numerisk værdi. Det bruges fx ved holdningsspørgsmål, hvor svarerne er på en skala fra fx meget enig, enig, hverken enig eller uenig, uenig, meget uenig. Her vil man give svarerne værdier fra 1 til 5. Dermed kan man udregne deskriptorerne. En anden mulighed i forhold til holdningsspørgsmål er at bede respondenterne selv indplacere sig på en skala fra 1-10 hvor den ene yderlighed er meget enig og den anden meget uenig. Hvis du kun vil lave chi-i-anden test på spørgsmålene er katagoriske variable også brugbare. Brug derfor tid på at overveje hvordan du vil databehandle, inden du formulerer spørgsmålene. Repræsentativitet Når man laver en spørgeskemaundersøgelse i samfundsfag, har man sjældent mulighed for at spørge hele den gruppe, man gerne vil undersøge. Vil man fx sige noget om alle elever på ungdomsuddannelserne i Danmark (populationen) er der ikke mulighed for at spørge dem alle. Det ville være for dyrt og tidskrævende. Derfor vælger man at spørge en delmængde af populationen ved at udtage en stikprøve og generalisere, ud fra hvad resultaterne fra stikprøven er. Hvis det skal være muligt at fortage denne generalisering fra stikprøve til population, er det dog nødvendigt, at stikprøven er repræsentativ for populationen - altså at den afspejler sammensætningen i populationen(fx på faktorer som køn, alder, uddannelse, geografi). Man skal være opmærksom på at der ikke findes nogle metoder garanterer repræsentativitet, men der er nogle måder, der er bedre end andre til at udtage stikprøver. 4
Nogle af de bedre måder at udtage stikprøver er fx at man kan lave en tilfældig udtrækning på en liste over alle i populationen. Man kan også udtrække klynger fx klasser tilfældigt fra en liste over alle klasser på de 4 ungdomsuddannelser i Danmark. En af de mindre gode måder er åbne spørgeskemaer på internettet et eksempel kunne være en avis hjemmeside. Her er problemet, at man jo skal ind på hjemmesiden først. For det første er det ikke alle, der har adgang til internettet, dernæst er målgruppen for avisen jo langt fra repræsentativ for hele populationen. Fejlkilder: Målefejl - Systematiske fejl- Fejl i databehandling Målefejl Et spørgeskema med uklare spørgsmål eller ikke gensidigt udelukkende svarkategorier giver anledning til fejl. Målefejl kan også opstå ved, at der er spørgsmål nogle respondenter ikke vil besvare, og det samlede resultat dermed har en hvis usikkerhed. Systematiske fejl Hvordan er stikprøven udvalgt? Er stikprøven repræsentativ? Altså spørger man rent faktisk dem, man gerne vil vide noget om? Hvis man gerne vil kende alle danskeres holdning til et emne, så skal vil det være en fejlkilde, at man laver undersøgelsen en hverdag mellem 12-15 i Føtex, hvor alle man spørger, må formodes at være pensionister, studerende eller arbejdsløse (sådan groft sagt)! Fejl i databehandling Kan fx opstå som menneskelige fejl når man overfører spørgeskemaer til et computerprogram (hvis der forgår en manuel indtastning). Det kan være fejl i det anvendte computerprogram eller det kan være fejlbehandling af data eller fejltolkninger af resultaterne. Kausalsammenhænge og skjulte variable Når man laver kvantitative undersøgelser er det jo for at finde forklaringer. Der er her vigtigt at være opmærksom på kausalsammenhænge. Kausalitet betyder at én ting forklarer en anden altså: hvad er årsag og hvad er virkning? Man skal altså altid overveje både retningen af en funden sammenhæng og om der er alternative forklaringer på sammenhængen. Afhængige og uafhængige variable Den afhængige variabel er den, vi ønsker at undersøge og forklare forskelle på. Den uafhængige variabel er den, vi mener, kan forklare forskellene på den afhængige variabel ud fra. Altså vil det være forskelle i den uafhængige variabel der er årsagen eller forklaringen på forskellene i den afhængige variabel. Hvis X påvirker Y, så er X den uafhængige variabel og Y den afhængige variabel. X Y Men det er ikke altid lige nemt at finde ud af hvad der er uafhængig og afhængig variabel. Ser man på sammenhængen mellem køn og indkomst er det oplagt, at det må være køn som er den uafhængige variabel, der påvirker den afhængige variabel indkomst. Det vil jo ikke give mening, at man ved en ændret indkomst ændrer køn! Modsat er det ikke oplagt, hvilken kausalsammenhæng der er, hvis man ser på variablene befolkningens holdning til et emne og mediernes indhold. Hvad er afhængig og uafhængig variabel påvirker eller afspejler medierne befolkningens holdninger? 5
Mellemliggende variable En mellemliggende variabel er en variabel som den uafhængige variabel virker igennem for at påvirke den afhængige variabel. En mellemliggende variabel kan både forstærke og svække sammenhængen mellem de to oprindeligt undersøgte variable og giver os ekstra oplysninger, der er interessante i forklaringerne. Hvis X påvirker Z som påvirker Y, er Z en mellemliggende forklaring, og det er både interessant at se på, hvordan X påvirker Y, men også hvad Z gør ved sammenhængen. X Z Y Et eksempel på en sammenhæng mellem alder og avislæsning. Her vil uddannelsesniveau være en mellemliggende variabel, da alder påvirker uddannelsesniveau og uddannelsesniveau påvirker avislæsning. Uddannelsesniveau må formodes at svække sammenhængen mellem alder og avislæsning. Tredje variable/skjult variabel Selvom der viser sig en sammenhæng mellem to variable behøver ikke være en kausalsammenhæng mellem de to variable. Der kan være en tredje variabel som forklarer ændringerne i begge variable, og at der dermed ikke er en reel sammenhæng mellem de to variable det siges, at der er en spuriøs sammenhæng mellem X og Y eller at der er en skjult variabel der forklarer sammenhængen. Z Y Et eksempel kunne være, at der er en sammenhæng Y mellem højde, og hvor god man er til matematik. Der er selvfølgelig ingen kausalsammenhæng mellem de to, men det er den skjulte variabel alder, der påvirker begge variable og forklarer sammenhængen. Jo ældre man er jo højere er man og jo bedre er man til matematik. Dog vil sammenhængen være begrænset til 20 års alderen, da man jo her ikke vokser mere. Samvariation/gensidig påvirkning Det er, som sagt, langt fra altid klart, hvad der er afhængig og uafhængig variabel variablene påvirker nogle gange hinanden. X X Y Et eksempel på det kunne eksempelvis være eksemplet fra tidligere med sammenhængen mellem variablene befolkningens holdning til et emne og mediernes indhold. 4. Hvor god er din undersøgelse? Når man ser på en statistisk undersøgelse er det to begreber, som bruges til at se på hvor god undersøgelsen er eller ikke er. Det første er validitet, hvilket betyder gyldighed eller rigtighed af et resultat. Validitet er et udtryk for, hvor godt man kan måle det, man gerne vil undersøge. Der er flere dele af validitetsbegrebet: Kan vi svare på vores problemstilling, ud fra de spørgsmål vi har stillet? Kan der fx være skjulte variable? Er de upræcise? Osv. Det kaldes målingsvaliditet. 6
Hvad man faktisk undersøger er gyldig i forhold til en allerede kendt definition. Det kaldes definitionsvaliditet. Kan du være sikker på, at en forskel i den uafhængige variabel har betydning for forskelle i den afhængige variabel. Her ses altså på kausalsammenhængene. Det kaldes også intern validitet. Kan undersøgelsen udvides til at sige noget om en større gruppe, end den der er undersøgt. Altså om man kan generalisere resultatet. Er stikprøven repræsentativ? Det kaldes ekstern validitet. Det andet begreb er reliabilitet, det betyder pålidelighed eller til at stole på. Og er altså et udtryk for, om en empirisk undersøgelse er pålidelig. For at en undersøgelse skal have høj reliabilitet, skal der kunne laves en tilsvarende undersøgelse og man skal her opnå samme resultater. Resultaterne skal altså være mulige at reproducere. 7