Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge; 6) Videre perspektiver.
Hvordan kan man behandle data? Tre niveauer Beskrivende statistik alene tallene selv Analytisk statistik antagelse om bagvedliggende idealfigur (fordeling) Modeller komplekse computerberegninger som bruges til at forudsige sammenhænge Jo højere målniveau (=tal) Jo flere muligheder for statistisk bearbejdning
Fra forberedelsen: Antagelser om sammenhænge Hvis ingen antagelser om sammenhænge mellem 2 spørgsmål, bliver det uoverskueligt! Hvis vi for eksemplets skyld antager, at hvert spørgsmål har bare 2 svarmuligheder, så kan 2 spørgsmål kan kombineres på 1 måde 3 spørgsmål kan kombineres på 6 måder 4 spørgsmål kan kombineres på 12 måder 5 spørgsmål kan kombineres på 20 måder n spørgsmål kan kombineres på n! (n-r)! måder r er antallet af spørgsmål, der skal indgå i kombinationen n! betyder, at man ganger et tal, n, med talrækken op til n: Eksempel: hvis n = 7 betyder n! 7*6*5*4*3*2*1
SPSS hvad er det? SPSS (originally, Statistical Package for the Social Sciences) PASW Statistics 17.0.3 - September 2009 IBM SPSS Statistics 19.0 - August 2010 Alternativer R
SPSS hvordan ser det ud?
SPSS 3 vinduer: Data Output - Log
SPSS hvad skal man gøre? Indledende øvelser 1/2 1. Hente data downloade fra elektronisk spørgeskema, importere fra Excel, indtaste direkte 2. Rådata kan sjældent bare bruges de skal først tjekkes for fejl Kategoriske variable - Udskriv frekvenser (Analyze descriptive Statistics frequences) - Vælg en variabel, vælg statistics, sæt hak ved min og max - Er antallet sandsynligt? Er der mange missing values og hvorfor? Kontinuerte variable - Udskriv frekvenser (Analyze descriptive Statistics frequences) - Sæk hak ved forskellige statistics - Er resultaterne sandsynlige? Fordeler besvarelserne sig fornugtigt
SPSS hvad skal man gøre? Indledende øvelser 2/2 3. Undersøg for deciderede fejl: Hvilket årstal er du født? Svar 1962 eller svar 62 Hvilke 3 ting betyder mest for dig? Svar 2 eller 5 ting Spørgsmål: Dyrker du motion. Svar nej. Andet spørgsmål: Hvad er dit erhverv? Svar flyttemand - Vælg Analyze Descriptive statistics Explore Hvert spørgsmål skal tjekkes: Er svarfordelingen sandsynlig? Er der underlige svar?
SPSS Indledende analyser Fx undersøg fordeling: -Er kurven til højre over respondenternes fødselsår normaltfordelt? Hvad hvis man deler gruppen op i mænd og kvinder er den så (stadig) normalfordlet?
SPSS beskrivelse af data vha grafer Brug Graphs chart builder Træk graftype og variable på plads
- Samme data kan vises på flere måder Her udgør hver gruppe 100% Her udgør hver kategori 100% Her udgør søjlerne tilsammen 100%
Boxplot Variabelen skal være kontinuert, men kan grupperes i forhold til kategorier
Ændring af data Man kan omkode data: Alder aldersintervaller: Respondenter født mellem 1960 1970 I 40 erne Kategorier færre kategorier: Meget enig og noget enig enig Lægge variable sammen til nye variable: Respondenter, der angiver ja til EU og kvinder EU-positive kvinder Brug Transpose Recode into new variable
Hvad kan man læse af tabeller?
At analysere relationer mellem variable Variabeltype Nominal nominal Nominal ordinal Måder at vise relationer mellem variablene Kontingenstabel Grupperede søjlediagrammer Kontingenstabel Grupperede søjlediagrammer (evt. akkumuleret) Metode at analysere relationen med Procentvis sammenligning ml. en af variablene Procentvis sammenligning ml. den nominelle variable Nominal skala Boxplot Sammenligning af middel eller median Ordinal - ordinal Kontingenstabel Grupperede søjlediagrammer Spearman korrelation Ordinal - skala Boxplot Spearman korrelation Skala - skala Scatterplot Hvis lineær: Pearson, hvis ikke-lineær: Spearman
At undersøge sammenhængen mellem holdning til forældres ansvar og køn 83. Hvilket af disse to udsagn beskriver bedst Deres mening om forældres ansvar/pligter over for deres børn? 1. Det er forældrenes pligt at gøre alt, hvad der står i deres magt for deres børn, uanset om det skulle gå ud over deres egen trivsel... 1 2. Forældre har også deres eget liv, og man kan ikke forlange, at de skal ofre deres egen trivsel for børnenes skyld... 2 3. Ingen af delene... 3
Svaret på spørgsmålet fordeler sig således Kan vi på baggrund af ovenstående konkludere, at kvinder går meget mere ind for, at Det er forældrenes pligt at gøre alt, hvad der står i deres magt for deres børn, uanset om det skulle gå ud over deres egen trivsel end mænd?
Opstille en hypotese Man tester altid konservativt altså H(nul): Der er ikke forskel på kvinder og mænd. Falder hypotesen bliver alternativet H(alt) tilfældet: Der er forskel på kvinder og mænd Vælg Descriptive Crosstab Variable Vælg Statistics sæt hak i Chi-square og Phi and Cramers V
2. Dette tal skal rapporteres sammen med tabellen. Det, der står er, at der er en chance på 7,6% for at forskellen, vist i tabellen, skyldes tilfældighed Konvention: p > 5%, dvs p > 0,05 kan vi ikke forkaste H(nul) 1. Her skal rapporteres ingen fejl. Dvs ingen celler må have expected < 5. Dette er en forudsætning for at kunne bruge chi-testen 3. Tabeller på 2*2 Phi, større V Samlet konklusion: Undersøgelsen viste ikke statistisk signifikant forskel på mænd og kvinder med hensyn til opfattelse af forældres ansvar. (p=0,076, Chi-square=5,166, df=2)