Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.

Relaterede dokumenter
SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

Basal Statistik - SPSS

Basal Statistik - SPSS

Basal Statistik - SPSS

Basal Statistik - SPSS

Basal Statistik - SPSS

Basal Statistik - SPSS

Basal Statistik - SPSS

Basal Statistik - SPSS

Vejledende besvarelse af hjemmeopgave, efterår 2018

Basal Statistik - SPSS

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018

Vejledende besvarelse af hjemmeopgave, efterår 2017

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Besvarelse af opgave om Vital Capacity

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Vejledende besvarelse af hjemmeopgave, forår 2018

Vejledende besvarelse af hjemmeopgave, forår 2019

Opgavebesvarelse, korrelerede målinger

Opgavebesvarelse, Basalkursus, uge 3

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences

Generelle lineære modeller

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 12. september / 116

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 10. september / 116

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences

Vejledende besvarelse af hjemmeopgave, forår 2017

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017

Opgavebesvarelse, Basalkursus, uge 3

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Ikke-parametriske tests

Phd-kursus i Basal Statistik, Opgaver til 1. uge

Besvarelse af vitcap -opgaven

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016

Kommentarer til øvelser i basalkursus, 2. uge

To-sidet variansanalyse

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Opgave 1: Graft vs. Host disease

Phd-kursus i Basal Statistik, Opgaver til 1. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Vejledende besvarelse af hjemmeopgave

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Klasseøvelser dag 2 Opgave 1

Opgavebesvarelse, Basalkursus, uge 2

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Program. 1. Flersidet variansanalyse 1/11

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse

Multipel Lineær Regression

Statistik Lektion 4. Variansanalyse Modelkontrol

SPSS introduktion Om at komme igang 1

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

Introduktion til SPSS

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse i R. Lene Theil Skovgaard. 11. februar / 116

MPH specialmodul Epidemiologi og Biostatistik

Plot af B j + ǫ ij (Y ij µ α i )): σ 2 : within blocks variance. σb 2 : between blocks variance

Opgavebesvarelse, brain weight

Basal Statistik. En- og to-stikprøve problemer. Eksempel på parrede data. Eksempel på parrede data. Faculty of Health Sciences

Faculty of Health Sciences. Basal Statistik. T-tests. Lene Theil Skovgaard. 17. september 2013

Basal statistik. Selve sproget. Grafik. Basale procedurer. Faculty of Health Sciences. Lille SAS Manual

Faculty of Health Sciences. Basal statistik. Lille SAS Manual. Lene Theil Skovgaard. 31. januar 2017

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Opgavebesvarelse, korrelerede målinger

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Forelæsning 11: Envejs variansanalyse, ANOVA

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Basal statistik. 30. januar 2007

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Indholdsfortegnelse PSpice modul 3. Forudsætninger. Forberedelse til øvelser

Program dag 2 (11. april 2011)

Opgavebesvarelse, brain weight

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 17 Multipel Lineær Regression

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Reeksamen i Statistik for biokemikere. Blok

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Faculty of Health Sciences. Logistisk regression: Interaktion Kvantitative responsvariable

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Vejledende besvarelse af hjemmeopgave, efterår 2018

Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november)

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Besvarelse af opgave om Vital Capacity

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Transkript:

Faculty of Health Sciences SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 22. januar 2018 1 / 20

SPSS APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Figurer: s. 4,9,17 Summary statistics: s. 5 T-tests mv.: s. 6-8 Ensidet ANOVA: s. 10-14, 16 Tosidet ANOVA: s. 18-19 2 / 20

Indlæsning For at indlæse allerede eksisterende data, benyttes menuen File/Open/Data Hvis data skal hentes fra nettet, må man først benytte File/Open/Internet Data, hvorefter man skriver stien http://publicifsv.sund.ku.dk/~lts/basal/data/vitamind.txt i Web location... samt det ønskede navn på datasættet i Dataset Name to Assign. I SPSS benyttes variabelnavnet land til de numeriske 1,2,4 og 6, medens country defineres som DK, SF, EI, PL eller med det fulde navn på landet. 3 / 20

Box plots Slide 3 Vi skal kun se på kvinder (category=2) fra Irland og Danmark (land=1 eller land=4), så vi benytter Data/Select Cases, hvor der afkrydses i If og skrives (land=1 land=4) & category=2. Herefter benytter vi Analyze/Descriptive Statistics/Explore, hvor vi sætter vitd i Dependent List, country i Factor List samt sætter hak i Plots. De kan også laves i Graphs/Graph Builder, hvor vitd trækkes over på Y-aksen, og country trækkes over på X-aksen. 4 / 20

Summary statistics Slide 4 For at få udregnet diverse størrelser for hvert land for sig, benyttes Data/Split file/compare Groups, hvor country sættes ind i feltet Groups Based on. Herefter går man ind under menuen Analyze/Descriptive Statistics, vælger Descriptives og flytter de ønskede variable (her blot vitd) over i Variable(s). Under Statistics kan man så sætte flueben ved de størrelser, vi ønsker udregnet (her Mean, Std. deviation, Minimum og Maximum). 5 / 20

Uparret T-test Slide 7-8 Vi skal igen udvælge kun 2 lande, se s. 4 Vi vælger Analyze/Compare Means/Independent Samples T-test, hvor vi sætter vitd over i Test Variable(s) og country i Grouping Variable. Under Define Groups vælges Group1 til 1 og Group1 til 4. 6 / 20

Dimensionering Slide 24-25 Der er noget, der hedder GPOWER...?? Det ved jeg desværre ikke så meget om (endnu)... 7 / 20

Nonparametrisk uparret test Slide 29-30 Mann-Whitney test eller Kruskal-Wallis test (approksimation for n > 25) Gå ind i menuen Analyse/Nonparametric Tests/Legacy Dialogs og vælg 2 Independent Samples, hvorefter vitd sættes i Test Variable List og land sættes i Grouping Variable. Under Test Type vælges Mann-Whitney U. Af en eller anden mærkelig årsag dur det her ikke at vælge country til Grouping Variable, det skal åbenbart (besynderligt nok) være en numerisk variabel her!? 8 / 20

Box plots Slide 33 Boxplottet skal her vise kvinder (category=2) fra alle landene, så vi må ind i Data/Select Cases og sørge for, at der er afkrydset i If, hvor der skal stå category=2. Herefter benytter vi Analyze/Descriptive Statistics/Explore, hvor vi sætter vitd i Dependent List, country i Factor List samt sætter hak i Plots og Box-plots laves i Graphs/Graph Builder, hvor vitd trækkes over på Y-aksen, og country trækkes over på X-aksen. 9 / 20

Ensidet ANOVA Slide 37ff Her benyttes ikke Analyze/Compare Means/One-Way ANOVA, da denne ikke giver estimater. Brug i stedet Analyze/General Linear Model/Univariate, hvor vi sætter vitd i Dependent Variable og country i Fixed Factor(s). Her kan vi vælge at se parameterestimater under Options, hvor vi afkrydser Parameter estimates. 10 / 20

Test af identiske spredninger Slide 45 Her kan vi vælge at se Levenes test for identiske spredninger i grupperne ved at afkrydse Homogeneity test under Options. eller man kan bruge Analyze/Compare Means/One Way ANOVA, med vitd i Dependent List og country i Factor, og under Options afkrydses Homogeneity of variance test 11 / 20

Modelkontrolplots for Vitamin D eksemplet, Slide 47 I opsætningen af Analyze/General Linear Model/Univariate (se s. 10) kan vi i Options vælge Residual plot, men... Vi kan også vælge at få mere kontrol over tingene ved at gemme residualer og predikterede værdier. Dette gøres ved at benytte Save-knappen og under Predicted Values vælge Unstandardized, og under Residuals f.eks. vælge Studentized Herefter benyttes Graph-menuerne. 12 / 20

Welch test - ANOVA for uens varianser, Slide 49 Her er man undtagelsesvis nødt til at bruge Analyze/Compare Means/One Way ANOVA, med vitd i Dependent List og country i Factor, og under Options afkrydses Welch 13 / 20

Tukey korrektion for vitamin D, Slide 56-57 Dette kunne gøres ved at gå ind i Analyze/Compare Means/One Way ANOVA, sætte vitd i Dependent List og country i Factor. Efterfølgende går man så ind i Post Hoc og foretager relevante afkrydsninger, f.eks. Tukey eller Tukey s b 14 / 20

Optælling af solvaner, Slide 63 Først skal vi definere variablen sol ved at benytte Transform/Recode into Different Variables, hvor sunexp sættes i Numeric Variable Output Variable, sol sættes i Name og der klikkes Change. Herefter klikkes Old and New Values, hvorefter man sætter 1 i Value og 0 i New value, 2 i Value og 1 i New value, 3 i Value og 1 i New value, Continue Herefter benyttes Analyze/Descriptive Statistics/Crosstabs/, hvor country sættes over i Row(s) og sol i Column(s). I Cells afkrydses Observed og Percentages: Row. 15 / 20

Non-parametrisk Kruskal-Wallis test, Slide 61 Gå ind i menuen Analyze/Nonparametric Tests/Legacy Dialogs og vælg K Independent Samples, hvorefter vitd sættes i Test Variable List og land sættes i Grouping Variable. Under Test Type vælges Kruskal-Wallis. Af en eller anden mærkelig årsag dur det her ikke at vælge country til Grouping Variable, det skal åbenbart (besynderligt nok) være en numerisk variabel her!? 16 / 20

Box-plot, opdelt efter to kategorier Slide 66 Benyt Graph/Chart Builder/Bar, vælg nr. 2 fra venstre og sæt country på X-aksen, vitd på Y-aksen og sol over i Cluster on X: set color. 17 / 20

Additiv tosidet ANOVA dvs. uden interaktion Slide 69-70 Brug Analyze/General Linear Model/Univariate, hvor vi sætter vitd i Dependent Variable og såvel country som sol i Fixed Factor(s). Derefter går vi i Model, vælger Custom og sætter såvel country som sol over i Model. For at få parameterestimater med, går vi i Options, hvor vi afkrydser Parameter estimates Under Save kan vi gemme de predikterede værdier. Dette opretter en ny variabel PRE_1 i datasettet. 18 / 20

Tosidet ANOVA med interaktion Slide 82-83 Vi starter med opsætningen som på s. 18, men under Model tilføjer vi nu et interaktionsled ved at markere både country og sol samtidig og under Type vælge Interaction før de tilføjes til Model 19 / 20

Udregning af predikterede værdier Slide 86 Under Save kan vi gemme de predikterede værdier. Dette opretter en ny variabel PRE_1 i datasettet. 20 / 20