Statistiske data Datamatricen Variable j Individer i X ij = x ij Anonymiserede og ækvivalente dataindivider Datamodellen Hvis dataindividerne er udvalgte repræsentanter fra en population, så er datamatrice en model - et bevidst forenklet billede af den population, som dataindividerne er udvalgt fra 1
Variabelbegrebet Variable er karakteriseret ved en standardiseret observations-, kodningsog registreringsmetode Der skelnes mellem variablen dvs den metode, der er blevet anvendt til observation og registrering af fænomenet og de forskellige realiserede værdier udfaldene Standardnotation: Store bogstaver referer til variable, små til udfald 2 X = x
Husk, at variablen er defineret ikke bare ved det, der registreres, men også ved hvordan og hvornår registreringen er fortaget Hvor stor var risikoen for at blive arbejdsløs i 1989, 1990 og 1991? Tabel 11 Relativ ledighed i 1989, 1990 og 1991 for personer med en lang videregående samfundsvidenskabelig uddannelse Hele året Fjerde kvartal Ultimo november År Ledigheds ramte Fuldtidsledige Ledigheds ramte Fuldtidsledige Antal ledige 1989 143 49 78 50 41 1990 154 55 88 58 49 1991 150 60 90 66 59 Svaret på spørgsmålet afhænger af, hvad der blev registreret i forbindelse med undersøgelsen af arbejdsløshed Beslutningen om, hvad der skal registreres hvad variablen skal indeholde er også en beslutning om at fravælge oplysninger Skalaens egenskaber har også betydning for hvorledes data kan analyseres 3
Variabelegenskaber 1) Skalatype, 2) Værdiområdet, 3) Designmæssige begrænsninger på den måde variablene varierer på, 4) Variablens relationer i forhold til andre variable, 5) Variablens fordeling Skalatypen Fire hierarkisk ordnede skalatyper: - nominalskalaer - ordinalskalaer - intervalskalaer - ratioskalaer Defineret ud fra hvilke sammenligninger af skalaværdier og hvilke omkodninger af variablen, der er meningsfulde 4
Eksempel Når De er sammen med Deres venner, sker det så, at I taler om politiske forhold? Svarkategorier: Ofte Nu og da Aldrig Ved ikke Forslag til kodning: 1: Ofte 2: Nu og da 3: Aldrig 9: Ved ikke 2: Ofte 1: Nu og da 0: Aldrig 3: Ved ikke 10: Ofte 21: Nu og da 38: Aldrig : Ved ikke 3: Ofte 2: Nu og da 1: Ved ikke 0: Aldrig 5
Geo-koder feks 1: København 2: Øerne (eksklusiv København) 3: Jylland Hvad betyder skalaværdierne? 6
Såfremt der er noget, De føler Dem virkelig stærkt overbevist om sker det da, at de forsøger at vinde venner, kolleger eller familie for deres synspunkt? (hvis ja): Sker det ofte, nu og da eller sjældent? Fire kategorier: 1: Ofte 2: Nu og da 3: Sjældent 4: Aldrig Aldrig Nu og da Ofte Sjældent Er kategorierne ækvidistante? Hvor ligger sjældent i forhold til de andre kategorier? 7
Hvor tilfreds eller utilfreds er De alt i alt med deres job? hvor der skal svares ved at krydse et tal af på følgende 10-punktsskala: Utilfreds = 1 2 3 4 5 6 7 8 9 10 = Tilfreds Er dette en intervalskala med ækvidistante kategorier? 8
Definition af skalatyper Skalatype Meningsfuld sammenligning Tilladelig omkodning Nominal Lighed/ulighed Alle 1-1 omkodninger Ordinal Interval Ratio Lighed/Ulighed Større end/mindre end Lighed/Ulighed Større end/mindre end Forskel Lighed/Ulighed Større end/mindre end Forskel Forhold Alle monotone omkodninger Ændring af nulpunkt og skalaenhed Ændring af skalaenhed 9
Variablens værdiområde - Er der tale om såkaldte kontinuerte eller diskrete variable? - Er der tale om et ubegrænset eller helt eller delvist begrænset værdiområde Utilfreds Tilfreds En kontinuert VAS-skala Variabeltaksonomi Variabeltype Diskret Kontinuert Tosidigt begrænset Kategoriskalaer (nominale og ordinale) Tælleskalaer Ikke-ideelle interval- og ratioskalaer Nedadtil begrænset Opadtil ubegrænset Tælleskalaer Absolutte andelsskalaer Ikke-ideelle intervalog ratioskalaer Ideelle ratioskalaer 10 Ubegrænset både nedadtil og opadtil Forekommer ikke Ideelle intervalskalaer
Designbundne og tilfældigt varierende variable De fleste variable varierer tilfældigt set med forskerens øjne Visse variable varierer på en måde, som forskeren har styr på Kausal og tidsmæssig variabelstruktur Visse variable kommer enten tidsmæssigt eller kausalt før andre 11