Program dag 2 (11. april 2011)



Relaterede dokumenter
Statistik II 1. Lektion. Analyse af kontingenstabeller

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Introduktion til SPSS

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

K.U Metode Skriveøvelse 1 Af Marie Hammer og Steffen Tiedemann Christensen. Indholdsfortegnelse Opgave Opgave 2...

SPSS introduktion Om at komme igang 1

Multipel Lineær Regression

- Panelundersøgelse, Folkeskolen, februar 2013 FOLKESKOLEN. Undersøgelse om syn på kønnets betydning for fag- og uddannelsesvalg

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Løsning til eksamen d.27 Maj 2010

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Kausalitet. Introduktion til samfundsvidenskabelig metode. Samfundsvidenskabelig metode. Hvad er metode? Hvad er kausalitet.

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Spørgeskemaundersøgelser og databehandling

Kvantitative Metoder 1 - Forår Dagens program

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik og skalavalidering. Opgave 1

Dag 1: 1) Fra problemformulering til spørgeskema-tematikker; 2) Hvordan hører data sammen; 3) Overvejelser om datas egenskaber; 4) Hvad kan man

Konfidensintervaller og Hypotesetest

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test

02402 Løsning til testquiz02402f (Test VI)

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Statistik Lektion 4. Variansanalyse Modelkontrol

Behandling af kvantitative data

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Stolpediagrammer for kategoriske data med -catplot-

Teknikker til analyse af tal med Excel

Kvantitative metoder, teori og praksis

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4

1 Problemformulering CYKELHJELM

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

R / RStudio. Intro til R / RStudio

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Indblik i statistik - for samfundsvidenskab

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Inklusions rapport i Rebild Kommune Elever fra 4. til 10. klasse Rapport status Læsevejledning Indholdsfortegnelse Analyse Din Klasse del 1

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik II 4. Lektion. Logistisk regression

Klargøring af data til aflevering til DDA. Instruks

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Maple-oversigt til matematik B-niveau: Rungsted Gymnasium Definer en funktion og funktionsværdier. Tegn grafen for en funktion.

Kønsproportion og familiemønstre.

POLITIETS TRYGHEDSUNDERSØGELSE I GRØNLAND, 2017

ELEVPRAKSIS. Teknisk rapport. Data fra lærersurvey i AUUC-konsortiets demonstrationsskoleprojekter. ELEVPRAKSIS l 1

Normalfordelingen og Stikprøvefordelinger

- Panelundersøgelse, Folkeskolen, februar 2013 FOLKESKOLEN. Undersøgelse om syn på medarbejderindflydelse i skolen og

Postoperative komplikationer

KORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Test og sammenligning af udvalgte regressionsmodeller Berit Christina Olsen forår 2008

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Eksamen i Statistik og skalavalidering

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Undervisningsbeskrivelse

Ikke-parametriske tests

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab

etniske minoriteter i Danmark

Bilag 4 til rapporten Idræt i udsatte boligområder

1 Multipel lineær regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Basal Statistik. Undervisningstider. Formål med kurset. Faculty of Health Sciences. Praktiske bemærkninger om kurset.

Transkript:

Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge; 6) Videre perspektiver.

Hvordan kan man behandle data? Tre niveauer Beskrivende statistik alene tallene selv Analytisk statistik antagelse om bagvedliggende idealfigur (fordeling) Modeller komplekse computerberegninger som bruges til at forudsige sammenhænge Jo højere målniveau (=tal) Jo flere muligheder for statistisk bearbejdning

Fra forberedelsen: Antagelser om sammenhænge Hvis ingen antagelser om sammenhænge mellem 2 spørgsmål, bliver det uoverskueligt! Hvis vi for eksemplets skyld antager, at hvert spørgsmål har bare 2 svarmuligheder, så kan 2 spørgsmål kan kombineres på 1 måde 3 spørgsmål kan kombineres på 6 måder 4 spørgsmål kan kombineres på 12 måder 5 spørgsmål kan kombineres på 20 måder n spørgsmål kan kombineres på n! (n-r)! måder r er antallet af spørgsmål, der skal indgå i kombinationen n! betyder, at man ganger et tal, n, med talrækken op til n: Eksempel: hvis n = 7 betyder n! 7*6*5*4*3*2*1

SPSS hvad er det? SPSS (originally, Statistical Package for the Social Sciences) PASW Statistics 17.0.3 - September 2009 IBM SPSS Statistics 19.0 - August 2010 Alternativer R

SPSS hvordan ser det ud?

SPSS 3 vinduer: Data Output - Log

SPSS hvad skal man gøre? Indledende øvelser 1/2 1. Hente data downloade fra elektronisk spørgeskema, importere fra Excel, indtaste direkte 2. Rådata kan sjældent bare bruges de skal først tjekkes for fejl Kategoriske variable - Udskriv frekvenser (Analyze descriptive Statistics frequences) - Vælg en variabel, vælg statistics, sæt hak ved min og max - Er antallet sandsynligt? Er der mange missing values og hvorfor? Kontinuerte variable - Udskriv frekvenser (Analyze descriptive Statistics frequences) - Sæk hak ved forskellige statistics - Er resultaterne sandsynlige? Fordeler besvarelserne sig fornugtigt

SPSS hvad skal man gøre? Indledende øvelser 2/2 3. Undersøg for deciderede fejl: Hvilket årstal er du født? Svar 1962 eller svar 62 Hvilke 3 ting betyder mest for dig? Svar 2 eller 5 ting Spørgsmål: Dyrker du motion. Svar nej. Andet spørgsmål: Hvad er dit erhverv? Svar flyttemand - Vælg Analyze Descriptive statistics Explore Hvert spørgsmål skal tjekkes: Er svarfordelingen sandsynlig? Er der underlige svar?

SPSS Indledende analyser Fx undersøg fordeling: -Er kurven til højre over respondenternes fødselsår normaltfordelt? Hvad hvis man deler gruppen op i mænd og kvinder er den så (stadig) normalfordlet?

SPSS beskrivelse af data vha grafer Brug Graphs chart builder Træk graftype og variable på plads

- Samme data kan vises på flere måder Her udgør hver gruppe 100% Her udgør hver kategori 100% Her udgør søjlerne tilsammen 100%

Boxplot Variabelen skal være kontinuert, men kan grupperes i forhold til kategorier

Ændring af data Man kan omkode data: Alder aldersintervaller: Respondenter født mellem 1960 1970 I 40 erne Kategorier færre kategorier: Meget enig og noget enig enig Lægge variable sammen til nye variable: Respondenter, der angiver ja til EU og kvinder EU-positive kvinder Brug Transpose Recode into new variable

Hvad kan man læse af tabeller?

At analysere relationer mellem variable Variabeltype Nominal nominal Nominal ordinal Måder at vise relationer mellem variablene Kontingenstabel Grupperede søjlediagrammer Kontingenstabel Grupperede søjlediagrammer (evt. akkumuleret) Metode at analysere relationen med Procentvis sammenligning ml. en af variablene Procentvis sammenligning ml. den nominelle variable Nominal skala Boxplot Sammenligning af middel eller median Ordinal - ordinal Kontingenstabel Grupperede søjlediagrammer Spearman korrelation Ordinal - skala Boxplot Spearman korrelation Skala - skala Scatterplot Hvis lineær: Pearson, hvis ikke-lineær: Spearman

At undersøge sammenhængen mellem holdning til forældres ansvar og køn 83. Hvilket af disse to udsagn beskriver bedst Deres mening om forældres ansvar/pligter over for deres børn? 1. Det er forældrenes pligt at gøre alt, hvad der står i deres magt for deres børn, uanset om det skulle gå ud over deres egen trivsel... 1 2. Forældre har også deres eget liv, og man kan ikke forlange, at de skal ofre deres egen trivsel for børnenes skyld... 2 3. Ingen af delene... 3

Svaret på spørgsmålet fordeler sig således Kan vi på baggrund af ovenstående konkludere, at kvinder går meget mere ind for, at Det er forældrenes pligt at gøre alt, hvad der står i deres magt for deres børn, uanset om det skulle gå ud over deres egen trivsel end mænd?

Opstille en hypotese Man tester altid konservativt altså H(nul): Der er ikke forskel på kvinder og mænd. Falder hypotesen bliver alternativet H(alt) tilfældet: Der er forskel på kvinder og mænd Vælg Descriptive Crosstab Variable Vælg Statistics sæt hak i Chi-square og Phi and Cramers V

2. Dette tal skal rapporteres sammen med tabellen. Det, der står er, at der er en chance på 7,6% for at forskellen, vist i tabellen, skyldes tilfældighed Konvention: p > 5%, dvs p > 0,05 kan vi ikke forkaste H(nul) 1. Her skal rapporteres ingen fejl. Dvs ingen celler må have expected < 5. Dette er en forudsætning for at kunne bruge chi-testen 3. Tabeller på 2*2 Phi, større V Samlet konklusion: Undersøgelsen viste ikke statistisk signifikant forskel på mænd og kvinder med hensyn til opfattelse af forældres ansvar. (p=0,076, Chi-square=5,166, df=2)