INTRODUKTION TIL KRITISK STATISTIK. på 1. semester i Metodefaget.



Relaterede dokumenter
Et oplæg til dokumentation og evaluering

Behandling af kvantitative data

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Grundlæggende metode og videnskabsteori. 5. september 2011

Statistik II 1. Lektion. Analyse af kontingenstabeller

Kapitel 8 Chi-i-anden (χ 2 ) prøven

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Grundlæggende metode og. 2. februar 2011

Hvad er skriftlig samfundsfag. Redegør

Personlig stemmeafgivning

NOTAT Mobning blandt sygeplejersker 2012

Metoder og struktur ved skriftligt arbejde i idræt.

1. Hvad er det for en problemstilling eller et fænomen, du vil undersøge? 2. Undersøg, hvad der allerede findes af teori og andre undersøgelser.

Skriftlig eksamen i samfundsfag

Dag 1: 1) Fra problemformulering til spørgeskema-tematikker; 2) Hvordan hører data sammen; 3) Overvejelser om datas egenskaber; 4) Hvad kan man

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

- Panelundersøgelse, Folkeskolen, februar 2013 FOLKESKOLEN. Undersøgelse om syn på kønnets betydning for fag- og uddannelsesvalg

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Seksuel chikane blandt sygeplejersker i 2012

Program dag 2 (11. april 2011)

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

En ny vej - Statusrapport juli 2013

Normalfordelingen og Stikprøvefordelinger

Rapport 23. november 2018

BESKÆFTIGELSESINDSATSEN IFØLGE BORGERNE I FRIKOMMUNER FEBRUAR 2014

Jacob Hviid Hornnes, Anne Christensen og Ulrik Hesse. Arbejdsnotat. Metode- og materialeafsnit til Sundhedsprofil for Gribskov Kommune

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Monitorering af danskernes rygevaner. Metodebeskrivelse m.m. Januar 2004

Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark.

For Myndighedsafdelingen Voksenhandicap 2013

Problemstillinger omkring spørgeskemaundersøgelser blandt etniske minoriteter. Vibeke Jakobsen SFI Det Nationale Forskningscenter for Velfærd

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

For Center for Myndighed, Socialpsykiatri og Udsatte Voksne 2014

Evaluering af sygedagpengemodtageres oplevelse af ansøgningsprocessen

Den danske befolknings deltagelse i medicinske forsøg og lægevidenskabelig forskning

Forhold til kolleger og ledelse

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Seksuel chikane på arbejdspladsen. En undersøgelse af oplevelser med seksuel chikane i arbejdslivet blandt STEM-ansatte

Københavnske ejerlejlighedspriser en meget begrænset indikator for hele landets boligmarked

Mobning på arbejdspladsen. En undersøgelse af oplevelser med mobning blandt STEM-ansatte

METODEBILAG FRIVILLIGRAPPORT , BEFOLKNINGSUNDERSØGELSEN

Stress. Grundet afrunding af decimaler kan der være tilfælde hvor tabellerne ikke summer til 100.

METODEBILAG FRIVILLIGRAPPORT , BEFOLKNINGSUNDERSØGELSEN. Tal om det frivillige Danmark. Om undersøgelsens metode. Spørgeskema.

Fagplan for statistik, efteråret 2015

LUP læsevejledning til afdelingsrapporter

Fremtiden visioner og forudsigelser

Hver anden vil benytte øget åbningstid i dagtilbud

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER

Kapitel 1 Statistiske grundbegreber

Analyse: God stemning i klasseværelset er afgørende for børns læring

Kvantitative metoder, teori og praksis

Analyse af dagpengesystemet

Skriftligt samfundsfag

JUSTITSMINISTERIETS FORSKNINGSKONTOR DECEMBER 2015 LÆGDOMMERES REPRÆSENTATIVITET. Undersøgelse vedrørende perioden til

Hvad siger statistikken?

Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.

Efteråret Undersøgelse af borgertilfredsheden på Jobcenter Rebild

Akademikeres psykiske arbejdsmiljø

Sådan skaber vi et bedre og længere seniorarbejdsliv

d e t o e g d k e spør e? m s a g

LUP læsevejledning til afdelingsrapporter

Folkebibliotekernes værdi målt ved borgernes betalingsvillighed

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Indblik i statistik - for samfundsvidenskab

Arbejdsliv og privatliv

Skolevægring. Resultater fra en spørgeskemaundersøgelse blandt skoleledere på danske folkeskoler og specialskoler

Kapitel 7 Forskelle mellem centraltendenser

Forberedelse. Forberedelse. Forberedelse

Mistanke om seksuelle overgreb mod børn i daginstitutioner

- Panelundersøgelse, Folkeskolen, februar 2013 FOLKESKOLEN. Undersøgelse om syn på medarbejderindflydelse i skolen og

Socialpsykiatri og Udsatte Voksne 2014

Det gode liv Et uddrag af resultaterne fra borgerpanelsundersøgelsen. Analyse, Viden & Strategi Efteråret 2017

Skoleevaluering af 20 skoler

Noter til SfR checkliste 3 Kohorteundersøgelser

Fagårsplan 10/11 Fag: Matematik Klasse: 7.ABC Lærer: Henrik Stillits. Fagområde/ emne

Samfundsfag og matematik

Inklusions rapport i Rebild Kommune Elever fra 4. til 10. klasse Rapport status Læsevejledning Indholdsfortegnelse Analyse Din Klasse del 1

Hus 20, hus P10 og hus 22: forelæsning kl samt opfølgning i eget hus kl

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

For Center for Myndighed, Socialpsykiatri og Udsatte Voksne 2014

Sundhedsstyrelsen Monitorering af danskernes rygevaner

Kønsproportion og familiemønstre.

Tips og vejledning vedrørende den tredelte prøve i AT, Nakskov Gymnasium og HF

Skolens formål med faget matematik følger beskrivelsen af formål i folkeskolens Fælles Mål:

c) For, er, hvorefter. Forklar.

Dagtilbudsledernes perspektiv på nyuddannede pædagoger. Bilag: Figurer

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

enige i, at der er et godt psykisk arbejdsmiljø. For begge enige i, at arbejdsmiljøet er godt. Hovedparten af sikkerhedsrepræsentanterne

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

LUP Fødende læsevejledning til afdelingsrapporter

Forvaltning / Politik og Administration / Socialvidenskab

Seksuel chikane inden for Privat Service, Hotel og Restauration

En intro til radiologisk statistik. Erik Morre Pedersen

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

BAGGRUND OG FORMÅL MED UNDERSØGELSEN

LUP læsevejledning til afdelingsrapporter

1 Problemformulering CYKELHJELM

Ordbog Biologi Samfundsfag Kemi: Se bilag 1 Matematik: Se bilag 2

Transkript:

INTRODUKTION TIL KRITISK STATISTIK på 1. semester i Metodefaget. Merete Watt Boolsen 2004

2 INDLEDNING I studieordning 2000 for faget Introducerende metode og videnskabsteori kan man se, at det blandt andet indeholder en introduktion til statistikken. Med nærværende lille hæfte peges på en række elementer, der er vigtige, når man ser på tal, der anvendes i forbindelse med samfundsvidenskabeligt arbejde og samfundsvidenskabelige analyser. Perspektivet er den kritiske læser/den kritiske student, der arbejder med egne tal som led i en analyse eller med andres tal, som led i en (sekundær) analyse 1. Der er mange måder man som forsker og student kan forholde sig kritisk til samfundsvidenskabelige undersøgelser og projekter. Men uanset hvilken diskurs, man vælger at arbejde indenfor, handler det overordnet om at sætte sig grundigt ind i en række metodologiske forhold omkring tallenes konstruktion, dvs. forhold der har at gøre med problemstillingen hvad er det, man ønsker at vise med undersøgelsen? planlægningen af undersøgelsen hvordan tilrettelægges undersøgelsen? 1 ordet kritisk anvendes her på samme måde som i en anden samfundsvidenskabelig disciplin: kildekritikken. Vibeke Ankersborg skriver (2002: 10): At være kritisk betyder ikke at være negativ. I sin grundbetydning betyder det kunsten at bedømme, hvilket i praksis vil sige at have en bevidst holdning til aldrig umiddelbart at ville acceptere noget for pålydende, samt evnen til at stille de rigtige spørgsmål om baggrund, holdninger selvmodsigelser o.m.m.

3 dataindsamlingen hvilke konkrete fremgangsmåder anvendes? og endelig dataanalysen hvordan beskæftiger man sig samlet med teorier, metodikker og data, der danner udgangspunkt for en analyse? Inden for den kritiske statistik eller den kritiske tabellæsning, anbefales at der stilles følgende spørgsmål - Hvad er formålet med tallene? - Hvordan er tallene indsamlet? (herunder: hvem er undersøgt, med hvilken metode, og med hvilket resultat?) - Hvordan er tallene analyseret? Nedenfor er en introduktion til statistikken som disciplin (afsnit 1), formålet med at indsamle talmateriale (afsnit 2), tabel-konstruktion (afsnit 3), tabel-læsning (afsnit 4), sammenhængen mellem de variable (afsnit 5), således at man kan stille kritiske spørgsmål til egne og andres kvantitative datamaterialer. Ud over den kritiske og spørgende tilgang til data er formålet også, at man kan blive redelig i sin forskning. Senere i studiet (samt i pensum) udfoldes de nævnte perspektiver og strategier; der er altså i dette hæfte tryk på ordet introduktion. Merete Watt Boolsen September 2004.

4 AFSNIT 1: STATISTIKKEN SOM DISCIPLIN Statistik er et område af matematikken, der søger at ordne data eller tal. I forbindelse med spørgeskemaundersøgelser har statistik til formål at give et koncentrat i form af de tal, der fremkommer, når informanternes svar er opgjort. Der er tre grundlæggende måder, som statistikken anvendes på til at beskrive data (den beskrivende statistik). Her anvendes mål for centrale tendenser og mål for variation. Gennemsnit, median og modalværdier (typiske værdier) er mål for centrale tendenser, idet man ved hjælp af et enkelt tal udtrykker noget om en gruppe. Variationsmål siger noget om, hvor forskellige de enkelte værdier i den undersøgte gruppe har været hvor meget de har varieret. Den beskrivende statistik hjælper med til at skabe overblik og orden i kaos. til at udvikle hypoteser. Det kan være, at der foreligger store mængder af data fx fra store spørgeskemaundersøgelser. Statistikken kan anvendes for at undersøge, om der er nogle mønstre i data, dvs. man udvikler hypoteser om forskellige sammenhænge under forskellige betingelser. Fx kan man være interesseret i at se, om holdninger og handlinger udtrykkes på en bestemt måde hos mænd og på en anden måde hos kvinder. Denne proces kaldes for udforskende data-analyse. Og til at efterprøve hypoteser (den generaliserende statistik). Behovet for at afprøve hypoteser skyldes, at man næsten altid ar-

5 bejder med begrænsede mængder af data, hvis resultater man ønsker at kunne generalisere fra til de større befolkningsgrupper (hvorfra det lille udvalg er trukket). Denne form for statistik kaldes generaliserende statistik og her signifikanstestes. Det betyder, at man kan sige noget om forholdet mellem to eller flere variable; om sammenhængen er tilfældig (dvs. ikke signifikant) eller om sammenhængen er signifikant (dvs. at den ikke kan skyldes tilfældige variationer, hvorved der er belæg for at antage, at der faktisk er forskel på den undersøgte parameter, som analysen vedrører). Imidlertid er det vigtigt at bemærke, at man alene kan udtrykke sig i sandsynligheder; der er hverken tale om bevis eller sikkerhed. For den kritiske student/forsker kan kort nævnes, at det er vigtigt - at kende de variables skalaniveau, - at kende forudsætningerne for at en test kan anvendes, - at undersøge om forudsætningerne for testet er opfyldt i den givne situation; - at tage stilling til, hvilken sandsynlighed man ønsker at arbejde med og - at vurdere hvad der kan konkluderes efter testen er gennemført.

6 AFSNIT 2: FORMÅLET MED AT INDSAMLE TALMATERIALE Der er forskel på hvad man vil med tal og indsamling af talmateriale. Inden for det samfundsvidenskabelige område skelnes traditionelt mellem følgende formål: I nogle undersøgelser er formålet at kunne generalisere fra de personer, der er undersøgt til personer, der ikke er undersøgt, i nogle undersøgelser er formålet alene at beskrive dvs. få viden om ganske bestemte forhold hos ganske bestemte grupper af personer, i nogle undersøgelser er formålet at kunne forstå og forklare en situation eller en udvikling, i nogle undersøgelser er formålet at kunne gøre forudsigelser, i nogle undersøgelser er formålet at kunne sammenligne resultater mellem forskellige grupperinger eller forskellige adfærdsmønstre hos forskellige grupper eller forskellige sygdomsforløb mv. i nogle undersøgelser er formålet at kunne vurdere processer eksempelvis udviklingsforløb, sammenhænge o.l. i nogle undersøgelser er formålet at kunne udvikle hypoteser om sammenhænge i nogle undersøgelser er formålet at kunne afprøve hypoteser. Undersøgelsens design skal afspejle formålet med undersøgelsen og undersøgelsens problematik. Det omvendte må ikke være tilfæl-

7 det. Statistikken og de statistiske metoder er et redskab i disse processer. Men der er ikke tale om en facitliste. Man kan foretage beregninger og dermed analysere data; vurderinger er det sidste led i processen. Her forsøger man at besvare spørgsmålet om, hvad denne nye viden betyder under bestemte synsvinkler eller ud fra bestemte politikker. Den kritiske statistik dvs. de kritiske spørgsmål, som man kan stille til tallene kan være med til at konklusioner revideres, modificeres, differentieres eller evt. fjernes. Neden for nævnes et par områder, som man med de kritiske briller kan interessere sig for inden for survey- eller spørgeskemaundersøgelser: udvalgsmetoder og bortfald 2. UDVALGSMETODER Valg af personer til en undersøgelse kan foregå på mange forskellige måder; men den måde, man vælger på, har konsekvenser for de konklusioner, der lader sig formulere. Neden for nævnes kort eksempler på udvalgsmetoder. (1) TILFÆLDIGT UDVALG foretages i princippet som om alle i universet var skrevet op på hver sin lille seddel, der var lagt ned i en stor hat, som man derefter trak sin stikprøve ud af. Udvalgssandsynligheden skal være den samme for alle. Det kan den også blive, hvis man anvender af tabeller over 2 udvalgsmetoderne er mere udførligt omtalt i Boolsen, 2004. Samt Mogens Dam m.fl., 2003, kap. 3

8 tilfældige 3 tal. At udvalget bliver repræsentativt sikres ved tilfældigheden - at alle har samme sandsynlighed for at komme med i udvalget. Jo større udvalget er, jo større bliver undersøgelsens præcision. (2) SYSTEMATISK UDVALG Her søger man at sikre repræsentativiteten i den undersøgte gruppe ved en nemmere metode end det tilfældige udvalg. Man udtager f.eks. hver 10. person på en liste. MEN hvis et systematisk udvalg skal være af samme karakter - lige så godt - som det tilfældige, skal udvælgelseskriteriet være aldeles irrelevant for det, man vil undersøge. (3) STRATIFICERET UDVALG Ved denne metode inddeles hele populationen i lag (strata) på en sådan måde, at de kendetegn, der undersøges, kan forventes at optræde med væsentlig forskellig hyppighed i det enkelte stratum. (4) PANEL Hvis en undersøgelse gentages med mellemrum, anvendes ofte et panel, dvs. et udvalg, som benyttes til flere beslægtede undersøgelser. (5) KLYNGEUDVALG Ved et klyngeudvalg vælger man ikke et enkelt individ ad gangen, men en gruppe personer (fx alle personer i en opgang eller i hele beboelsesejendommen). (6) BEVIDST UDVALG Ved et bevidst udvalg vælger forskeren bestemte personer ud. Ulempen er, at det alene afhænger af forskeren eller studenten, om udvalget bliver repræsentativt. 3 de fleste statistiske tabelværker indeholder sådanne tabeller.

9 Et bevidst udvalg kan i nogle (specielt studie-) sammenhænge blive til et bekvemt udvalg. Danner man sit udvalg ved at henvende sig til forbipasserende på gaden, vennerne, kollegerne ved frokostbordet, familien eller folk, der står opført i telefonbogens spalte 1171 slipper man naturligvis for en masse besvær i forbindelse med undersøgelses tilrettelæggelsen. At anstrengelserne alligevel ikke står mål med resultaterne siger sig selv. (Fisker, m.fl. 1995: 53) Jeg vil udtrykke det lidt enklere: man slipper for at fortælle andre om konklusionerne; for man ved ikke, hvem de gælder for ud over vennerne, kollegerne, familien osv. og det vil næppe være repræsentativt. BORTFALD Det er så godt som altid umuligt at få svar fra hele udvalget. Den del, der ikke svarer, kaldes bortfaldet. I spørgeskemaundersøgelser er det centrale spørgsmål, om bortfaldet har betydning for vurderingen af undersøgelsens resultat. Som udgangspunkt må man sige, at et bortfald altid vil skævvride et resultat (Bystöm, 1990: 263). Men man kan forsøge at få et bedre indblik i, hvad der karakteriserer bortfaldet; idet man gennem en såkaldt bortfaldsanalyse kan undersøge, om bortfaldet er væsentlig anderledes sammensat end de, der svarede. Hvis det

10 er tilfældet, kan det betyde, at den del, der har svaret, ikke længere er repræsentativ 4. Hvis de to grupper (de, der har svaret, og de, der ikke har svaret) adskiller sig fra hinanden, kan man antage, at denne forskel forplanter sig til undersøgelses-resultaterne - og dermed har en virkning. Er der ingen forskel, betyder det imidlertid ikke, at bortfaldet er uden betydning for undersøgelsens resultater; det er muligt at den egenskab, som vi undersøger, kan optræde forskelligt i de to grupper, men at det ikke behøver at vise sig, når vi sammenligner grupperne på de variable, som vi har mulighed for at sammenligne på 5. I mange undersøgelser antages imidlertid, at hvis bortfaldet stort set har samme sammensætning som besvarelserne, kan man regne med, at det er faktorer, som er undersøgelsen uvedkommende, der har bevirket bortfaldet, og besvarelserne kan da stadig anses for repræsentative for hele populationen. HVOR STORT ELLER LILLE MÅ BORTFALDET VÆRE? Hvor stort eller lille må bortfaldet være, hvis vi ønsker at kunne generalisere fra dem, der har besvaret vores spørgeskemaundersøgelse blandt tilfældigt udtrukne personer? problemet kaldes nonresponse (manglende svar); og det er alvorligt i mange surveys. En tommelfingerregel siger, at hvis der er 15% i stikprøven, der ikke 4 Byström kalder dette for en struktursammenligning. 5 Byström, 1990: 263

11 besvarer spørgeskemaet, er det problematisk at generalisere til hele populationen 6. Bortfaldsproblematikken er størst ved postspørgeskemaundersøgelser. Det er svært at sige noget præcist om, hvor stort eller hvor lille, bortfaldet må være, men nedennævnte variationsområder er oversat til vurderinger af svarprocenter i spørgeskemaundersøgelser (Bryman, 2000: 132 efter Mangione, 1995: 60-1) højere end 85%: strålende 70-85%: udmærket 60-70%: akkurat acceptabelt 50-60%: mindre acceptabelt mindre end 50%: uacceptabelt 6 Agresti & Finlay, 1997, nævner tallet 20%.

12 Figur 1: Et anseeligt bortfald i en survey 95%. I 1987 præsenterede Shere Hite resultatet af en survey, som hun havde gennemført på voksne amerikanske kvinder. En af hendes konklusioner var, at 70% af de kvinder, der havde været gift mindst 5 år, havde seksuelle forhold uden for ægteskabet. Hun baserede sin konklusion på spørgeskemabesvarelser fra hele 4500 kvinder. Imidlertid var spørgeskemaet sendt til i alt 100.000 kvinder. Man kan ikke vide, om de 4,5%, der besvarede spørgeskemaet, er repræsentative for de 100.000 kvinder, der var udvalgt til at modtage spørgeskemaet men sandsynligheden er stor for, at de 4,5% ikke er repræsentative for de 100.000 kvinder. Og sandsynligheden for at de kvinder, der besvarede spørgeskemaet, er repræsentative for samtlige amerikanske kvinder, er formentlig endnu mindre. Det virker umiddelbart indlysende, at et bortfald som i Shere Hites undersøgelse på 95,5% må betyde, at resultaterne ikke kan anses for at være repræsentative. (efter Agresti & Finlay, 1977) HVAD KUNNE HUN HAVE GJORT, DA HUN OFFENTLIGGJORDE RESULTATERNE? Shere Hite kunne have sagt: dette spørgeskema har været sendt ud til 100.000 kvinder og 4500 har besvaret det. Blandt disse kvinder angiver 70%, at osv.. Undersøgelsen kan ikke anses for at være repræsentativ for amerikanske kvinder. Hvis man sammenligner dem, der har besvaret skemaet med andre amerikanske kvinder, viser det sig, at de adskiller sig med hensyn til osv. (konklusionerne kunne evt. være suppleret med en såkaldt bortfaldsanalyse). Notabene: En undersøgelse bliver ikke nødvendigvis ringere af, at den ikke er repræsentativ. Men analyserne bliver direkte forkerte, hvis resultaterne præsenteres som sådanne. (Efter Boolsen, 2004b: 26)

13 AFSNIT 3: TABELKONSTRUKTION HVORDAN LÆSES EN TABEL? 7 De fleste tabeller er opbyggede efter samme princip, og når man har forstået det, er det relativt nemt at "læse" en tabel. En tabel består af en forspalte og et hoved samt nogle oplysninger, der er knyttet til disse. Endvidere har de fleste tabeller en overskrift, der siger, hvilke data, der indgår. Figur 2: Tabelskabelonen : Tabel nr. Tabeloverskrift Tabelhoved (kategorier) Forspalte (kategorier)...... søj-.. ler...............angivelse af regneenhed... rækker...... Horisontal randfordeling (rækkesummer) Vertikal randfordeling (søjlesummer) Anmærkning: (generelle, nødvendige oplysninger) Noter: (specifik information om indholdet i de enkelte kategorier) Kilder: (hvorfra kommer tabellens materiale?) Totalsum 7 fra (1) Boolsen & Hansen, 1998: Forstå statistikken fra beregninger til analyse og vurderinger. C.A. Reitzels Forlag. (2) Boolsen, 2004: Fra spørgeskema til statistisk analyse, C.A. Reitzels forlag.

14 En tabel skal se ud - og omfatte så mange oplysninger - at den kan læses "for sig selv", dvs. uafhængig af teksten i artiklen. Først skal man finde ud af, hvad det er for en type oplysninger, der står inde i tabellen. Dernæst skal man finde ud af, hvad eller hvem disse oplysninger vedrører. Det kan man se på forspalten og hovedet. Og for det tredje skal man finde ud af, om der er nogle forbehold. Sådanne oplysninger er ofte anført som fodnoter eller anmærkninger under tabellen. Det er min erfaring, at mange tabeller i samfundsvidenskabelige rapporter er svære at læse simpelthen fordi tabellen ikke er stillet op, så det er muligt at vide eller få overblik over, hvad den handler om. Det er naturligvis uacceptabelt og det er ofte forklaringen på, at nogle føler sig afmægtige over for tabeller. Men hvis en tabel eller en præsentation af tal er uforståelig eller ufuldstændig, kan den kun med besvær (eller eventuelt slet ikke) anvendes til eget forskningsbrug.

15 AFSNIT 4: TABELLÆSNING 8 Afhængige og uafhængige variable Tabeller med mange tal skal kondenseres (dvs. sammentrænges) for at blive mere overskuelige. Men det er ikke helt ligegyldigt, hvordan man forsøger at sammentrænge sine tal dvs. skabe orden i kaos. Hvis ikke man tænker sig om, kan man faktisk opnå præcis det modsatte. Et tilfældigt valgt eksempel gennemgås neden for. Tabel 4.1: Boligforhold. Husstande med 1 voksen kvinde fordelt efter dennes alder samt efter hvorvidt der var hjemmeboende børn eller ikke. 1984. Absolutte tal. - 25 år 25-34 år 35-49 år 50-66 år 67 år+ I alt med børn antal 5961 antal 28.037 antal 46.672 antal 10.720 antal 136 antal 91.526 uden børn 36.269 28.343 27.147 95.977 197.659 385.395 I alt 42.230 56.380 73.819 106.697 197.795 476.921 Anmærkning: tabellen omfatter en tælling foretaget af Danmarks Statistik d. 1. januar 1984. Noter: der er tale om børn under 26 år. Kilde: Materialet er bearbejdet på grundlag af tabel fra publikationen: Kvinder & mænd, Danmarks Statistik, 1985, p. 26. KOMMENTAR til tabel 4.1: Tabellen fortæller, at der i Danmark i 1984 var knap 500.000 husstande med 1 voksen kvinde. Godt 42.000 var under 25 år, godt 56.000 var mellem 25 og 34 år, osv. osv. hele tabellen kan oversættes til ord, når indholdet skal beskrives, men det er ikke sikkert, at vi får et større overblik over materialet af den grund. Absolutte tal kan ofte virke uoverskuelige, og når det er tilfældet er det er svært at konkludere, hvad tabellen siger, og det er 8 dette afsnit er i hovedtræk taget fra Boolsen, 2004

16 helt umuligt at foretage vurderinger af situationen. Derfor kan procentberegninger med fordel foretages. Dette kan ske på flere måder: vertikalt, horisontalt eller totalt. Men det er ikke ligegyldigt, hvilken måde, der vælges. Et procent tal fremkommer ved, at et mindre tal divideres med et større og ganges med 100. Et procent tal angiver således en andel af noget. Dette noget er procentbasis. Man skal kende og forstå procentbasis, inden meningsfulde konklusioner kan drages. Tabel 4.2: Boligforhold. Husstande med 1 voksen kvinde fordelt efter dennes alder samt efter hvorvidt der var hjemmeboende børn eller ikke. 1984. Pct. tal. - 25 år 25-34 år 35-49 år 50-66 år 67 år+ I alt med børn % 7 % 31 % 51 % 12 % 0 % 101 uden børn 9 7 7 25 51 99 I alt 9 12 15 22 41 99 Anmærkning: tabellen omfatter en tælling foretaget af Danmarks Statistik d. 1. januar 1984. Pct. basis er 476.921 kvinder. Noter: der er tale om børn under 26 år. Kilde: Materialet er bearbejdet på grundlag af tabel fra publikationen: Kvinder & mænd, Danmarks Statistik, 1985, p. 26. KOMMENTAR til tabel 4.2: I denne tabel er der foretaget horisontale (lodrette) procentfordelinger, hvilket betyder, at man kan foretage en sammenligning af tallene vertikalt, når man skal beskrive data. Vi har taget den ene variabel - med børn/uden børn - og for hver af disse to værdier viser vi, hvorledes den - i statistisk forstand - betingede fordeling af den anden variabel: kvindernes alder, varierer. Det betyder, at vi kan sige, at med børn/uden børn er den uafhængige variabel og at kvindernes alder er den afhængige; eller sagt på en anden måde: kvindernes alder er afhængig af, om de bor med eller

17 uden børn... Det giver ingen mening. Det giver mere mening, at gøre det modsatte. Se tabel 4.3. Tabel 4.3: Boligforhold. Husstande med 1 voksen kvinde fordelt efter dennes alder samt efter hvorvidt der var hjemmeboende børn eller ikke. 1984. Pct. tal. - 25 år 25-34 år 35-49 år 50-66 år 67 år+ I alt med børn procent 14 procent 50 procent 63 procent 10 procent 0 procent 19 uden børn 86 50 37 90 100 81 I alt 100 100 100 100 100 100 Anmærkning: tabellen omfatter en tælling foretaget af Danmarks Statistik d. 1. januar 1984. Pct. basis er 476.921 kvinder. Noter: der er tale om børn under 26 år. Kilde: Materialet er bearbejdet på grundlag af tabel fra publikationen: Kvinder & mænd, Danmarks Statistik, 1985, p. 26. KOMMENTAR til tabel 4.3: I denne tabel er der foretaget vertikale procentfordelinger, hvilket betyder, at man kan foretage en sammenligning af tallene horisontalt, når man skal beskrive data. Rent teknisk har vi taget den ene variabel - kvindernes alder - og for hver af disse kategorier viser vi, hvorledes den - i statistisk forstand - betingede fordeling af den anden variabel: med børn/uden børn varierer. Det betyder, at vi kan sige, at kvindernes alder er den uafhængige variabel, og at med børn/uden børn er den afhængige; eller sagt på en anden måde: spørgsmålet om, hvorvidt kvinderne bor med eller uden børn, er afhængig af deres alder. Denne måde at præsentere tallene på giver mening. Konklusionen er, at det mest almindelige for enlige kvinder er at bo sammen med børn, når kvinderne er i aldersgruppen 35-49 år. I aldersgruppen 25-34 år er det lige almindeligt for enlige kvinder at bo med som uden børn. Der er næsten ingen kvinder (i pct. svarer det til 0, men som det fremgår af

18 de absolutte tal i tabel 1, er der faktisk 136), der bor sammen med børn, når de er 67 år gamle eller derover. Den 3. linie i tabellen siger det samme - nemlig, at det er mest almindeligt blandt enlige kvinder, der er helt unge eller over 50 år, at bo uden hjemmeboende børn (det gælder for henholdsvis 86% og 90%) 9. Ved opdelingen i afhængig og uafhængig variabel tages stilling til årsags-forholdet. Den uafhængige variabel er "årsagen" og den afhængige variabel er "virkningen"/effekten. Afbildes materialet i et koordinatsystem vil den uafhængige variabel typisk være på x-aksen, mens den afhængige placeres langs y-aksen. Tabel 4.4: Boligforhold. Husstande med 1 voksen kvinde procentvis fordelt efter kombinationen af kvindernes alder samt efter hvorvidt der var hjemmeboende børn eller ikke. 1984. Pct. tal. - 25 år 25-34 år 35-49 år 50-66 år 67 år+ I alt Pct. basis med børn % 1 % 6 % 10 % 2 % 0 % 19 91.526 uden børn 8 6 6 20 41 82 385.395 I alt 9 12 16 22 41 101. Pct. basis 42.230 56.380 73.819 106.697 197.795. 476.921 Anmærkning: tabellen omfatter en tælling foretaget af Danmarks Statistik d. 1. januar 1984. Pct. basis er 476.921 kvinder. Noter: der er tale om børn under 26 år. Kilde: Materialet er bearbejdet på grundlag af tabel fra publikationen: Kvinder & mænd, Danmarks Statistik, 1985, p. 26. 9 Det kan forekomme, at en arbejdsgiver i sin vurdering af en kvindelig ansøger, inddrager spørgsmålet om hendes børn og civilstand. Hvis han/hun har særlige forestillinger om, hvordan disse forhold kan påvirke arbejdsindsatsen, kan han/hun evt. på forhånd vælge kvinder med en vis alder ud til samtale. Arbejdsgiveren foretager med andre ord en vurdering, når han læser tallene.

19 KOMMENTAR til tabel 4.4: Med denne tabel, hvor hele materialet er fordelt procentuelt, kan man få overblik over, hvor meget de enkelte grupper "fylder". Beregningen kan f.eks. tage udgangspunkt i en socialpolitisk debat, hvor man ønsker at vide, hvor stor andelen af enlige kvinder under 25 år med hjemmeboende børn er - den er 1% 10. Omvendt kan man se, at den største gruppe af enlige kvinder er de 67+ årige, der ikke bor sammen med børn - den er på 41%. NB Læg i øvrigt mærke til, at i denne tabel giver procentberegningerne 101%. Man kan altid overveje, om man af hensyn til evt. ukyndige (statistik) læsere skal angive procentsammenlægninger til 100% - dvs. foretage simple afrundinger af tallene, eller om man ønsker at anvende de faktisk beregnede tal. Konklusionen af de gennemgåede tabeller er, at tabel 4.3 den mest meningsfulde, og man kan i forlængelse heraf overveje, om man ikke kan nøjes med at bringe en del af tabellen - f.eks. den linie eller række, der indeholder procent tallene for de kvinder, der bor sammen med børn (dvs. række 1). I den tabel, der danner udgangspunkt for gennemgangen af ovenstående tabeller, er endvidere anført tallene for enlige mænd. Det betyder, at man kan få et (hurtigt) overblik over de to køns fordeling på alder og hvorvidt, de bor alene eller sammen med børn ved at betragte tabel 4.5. 10 en politiker, der er modstander af (øget) indsats over for unge enlige mødre, kunne f.eks. inddrage denne tabel i sin argumentation.

20 Tabel 4.5: Andelen af henholdsvis enlige kvinder og enlige mænd, der bor sammen med børn - fordelt efter husstandsoverhovedets alder. 1984. KVINDER MÆND Procentbasis - 25 år med hjemmeboende børn, % med hjemmeboende børn, % Kvinder abs. Mænd abs. 14 0 42.230 39.164 25-34 år 50 3 56.380 60.740 35-49 år 63 16 73.819 60.884 50-66 år 10 8 106.697 55.124 67+ år 0 1 197.795 58.981 I alt 19 6.. %basis 91.526 16.424 476.921 274.893 Anmærkning: Tabellen omfatter en tælling foretaget af Danmarks Statistik d. 1. januar 1984. Noter: Der er tale om børn under 26 år. Kilder: Materialet er bearbejdet på grundlag af tabel fra publikationen: Kvinder & mænd, Danmarks Statistik, 1985, p. 26. KOMMENTAR til tabel 4.5: Det kan meget vel tænkes, at der vil være læsere, der ikke opfatter, at der i ovennævnte tabel er tale om horisontale procentfordelinger, fordi der ikke er angivet tallene for dem, der ikke bor med børn (14% af enlige kvinder under 25 år bor sammen med børn; 50% af enlige kvinder mellem 25-34 år bor sammen med børn, osv.). For at gøre billedet tydeligt kan man vise tallene som i tabel 4.6 og 4.7 nedenfor, idet der alene er vist tallene for de unge.

21 Tabel 4.6: Fuldstændig udskrift af række 1 i tabel 4.5 (kvinder alene). Kvinder ALDER med hjemmeboende børn uden hjemmeboende børn I alt pct. basis % % % - 25 år 14 86 100 42.230 Kilde: Kvinder & mænd, Danmarks Statistik, 1985, p. 26. Tabel 4.7: Fuldstændig udskrift af række 1 i tabel 4.5 (mænd alene). Mænd ALDER med hjemmeboende børn uden hjemmeboende børn I alt pct. basis % % % - 25 år 0 100 100 39.164 Kilde: Kvinder & mænd, Danmarks Statistik, 1985, p. 26. For at fuldstændiggøre eksemplet ses nedenfor den tabel, der har dannet udgangspunkt for alle beregningerne og analyserne:

22 Tabel 4.8: Husstande med 1 voksen person fordelt efter dennes alder 1. januar 1984. KVINDER MÆND ALDER uden børn under 26 år med børn under 26 år uden børn under 26 år med børn under 26 år under 25 år antal 36.269 antal 5961 antal 39.118 antal 46 25-34 år 28.343 28.037 58.731 2009 35-49 år 27.147 46.672 51.231 9653 50-66 år 95.977 10.720 50.709 4415 67 år + 197.659 136 58.680 301 I ALT 385.395 91.526 258.469 16.424 Kilde: Kvinder & mænd, Danmarks Statistik, 1985, p. 26. Bemærk i øvrigt, at én ting er at læse tabellen og dermed sige, hvad der står i den. En anden ting er at vurdere tabellen og dermed give udtryk for om en eller anden værdi er høj eller lav i forhold til en bestemt vinkel eller et bestemt udgangspunkt. Når man beskriver tabeller, refereres blot deres indhold. Når man vurderer tabeller, sker det altid i forhold til et eller andet udgangspunkt. Man er sjældent uenige om at referere tal, men uenighederne kan opstå, når man vurderer dem. Derfor er det en god idé at gå til tabelmaterialet i en undersøgelse og dermed til det oprindelige spørgeskema og ikke nøjes med at læse, hvad forskeren skriver. Man skal gøre sig klart: hvad vil jeg med disse tal? hvorfor er de vigtige for min argumentation? hvad er det, jeg selv ønsker at vise? hvad er mit faglige og videnskabsteoretiske udgangspunkt?

23 hvordan er tallene indsamlet? hvordan har forskningsstrategi og -design set ud i den pågældende undersøgelse? hvis der er tale om en survey-undersøgelse, hvis resultater man ønsker at generalisere: hvordan ser svarprocenten ud? er der foretaget bortfaldsanalyser (i tilfælde af lav svarprocent) hvordan ser resultatet at den ud? osv. hvad har man konkret spurgt om (= spørgeskemaspørgsmålene)? i hvilken sammenhæng er spørgsmålene blevet stillet? Der kan (og bør) stilles mange spørgsmål til de undersøgelser, som man anvender i forbindelse med sin egen forskning eller egen argumentation. Det er umuligt at nævne dem alle, men SUND FOR- NUFT, når man læser og vurderer andres undersøgelser (og når man gennemfører egne) er en vigtig parameter.

24 AFSNIT 5: SAMMENHÆNGE 11 Er der en sammenhæng mellem børns og forældres intelligens? mellem kvinders højde og vægt? Er matematisk begavede studenter dårlige til sprog og sproglige studenter dårlige til matematik? Får børnehaveklassebørn det nemmere senere i skolen end børn, der ikke har gået i børnehaveklasse? Medfører uddannelse bedre kvalitet i opgaveløsninger? Disse og tilsvarende problemstillinger, hvor forholdet mellem 2 variable skal beskrives, behandles ad statistisk vej via en række mål for sammenhænge 12 og statistisk signifikans 13. Kausalitet, forudsigelse og forklaring er almindelige begreber i forskningen, hvor de er integrerede i det teoretisk arbejde. Hvad angår den første kausaliteten - er den det mest almindelige og anvendes, når der er tale om en årsag og en virkning. Generelt plejer man at sige, at følgende forhold skal være tilstede, for at man kan tale om kausalitet: 1. en tidsmæssig rækkefølge mellem de variable, hvor årsagen kommer før virkningen, 2. en i statistisk forstand målt sammenhæng (= korrelation), 3. udelukkelse 11 for yderligere diskussion henvises til Boolsen, 2004. 12 det er altid hensigtsmæssigt at have tænkt sig om, inden den statistiske analyse påbegyndes, dvs. at have formuleret nogle hypoteser om mulige eller forventede sammenhænge; det modsatte ikke at gøre dette kan nemt føre til, at analysen bliver uden fokus og dermed eventuelt overflødig, uoverskuelig og uinteressant. 13 I samfundsvidenskaberne kan vi bedst lide, at tale om kausale sammenhænge kausalitet men ofte er der alene tale om sammenhænge.

25 af andre plausible forklaringer, og 4. en teoretisk forklaring, der sandsynliggør ideelt set forudsiger sammenhængen 14. Figur 3: Oversigt over relationerne mellem kausale variable (a) X + Y (b) X 1 X 2 + + _ + Y (c) + + X Z + Y (d) X + Y _ Z X 1 (e) + _ Z + X 2 _ Y Bemærkninger: I en kausal sammenhæng er der en årsag og en virkning. Den enkleste model har to variable, hvor X almindeligvis betegner årsag og Y effekt/virkning. Forholdet mellem de variable er symboliseret ved pile, og de viser kausalitetens retning (fra uafhængig til afhængig variabel). 14 Neuman, 2000: 51 ff samt Andersen, 1997

26 Sammenhængen kan være enten positiv eller negativ. En positiv sammenhæng betyder, at en højere værdi på den ene variable er ledsaget af en højere værdi på en anden. I figuren viser model (a) den simpleste kausale model med to variable. Model (b) viser et mere sammensat forhold, idet der er to kausale variable. Model (c) og (d) identificerer også forhold mellem tre variable, men den teoretiske kausale kæde er anderledes. Model (e) illustrerer en model med fire variable. To kausale variable er forbundne, men ifølge teorien er ingen af dem årsag til den anden (de finder muligvis sted samtidig). (Neuman, 2000: 56) UNDERSØGELSE AF FORHOLDET MELLEM TO VARIABLER Den enkleste måde at undersøge forholdet mellem to variabler på er at stille dem op i en tabel eller ved at tegne dem op i et koordinatsystem. Mål for sammenhæng har til formål at vise styrken og retningen af samvariationen mellem to variabler. I tilknytning til sammenhængsmål anvendes statistiske signifikanstest til at estimere sikkerheden for, at en observeret sammenhæng også eksisterer i den samlede population. Der findes mange forskellige sammenhængsmål. Hvilket mål, der egner sig til en given analyse, afhænger af, hvorvidt variablen er målt på nominalskala-, ordinalskala- eller intervalskala-niveau.