Basal Statistik - SPSS

Relaterede dokumenter
Basal Statistik - SPSS

Basal Statistik - SPSS

Basal Statistik - SPSS

Basal Statistik - SPSS

Basal Statistik - SPSS

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018

Basal Statistik - SPSS

Basal Statistik - SPSS

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

Basal Statistik - SPSS

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Vejledende besvarelse af hjemmeopgave, forår 2019

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Opgavebesvarelse, brain weight

Vejledende besvarelse af hjemmeopgave, forår 2018

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, forår 2017

Opgavebesvarelse, korrelerede målinger

Multipel Lineær Regression

Besvarelse af opgave om Vital Capacity

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Statistik Lektion 17 Multipel Lineær Regression

Opgave 1: Graft vs. Host disease

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Statistik Lektion 4. Variansanalyse Modelkontrol

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Generelle lineære modeller

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017

Modul 11: Simpel lineær regression

Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Basal Statistik. Simpel lineær regression. Problemstillinger ved multipel regression. Multipel regression. Faculty of Health Sciences

Løsning til øvelsesopgaver dag 4 spg 5-9

Statistik Lektion 16 Multipel Lineær Regression

Phd-kursus i Basal Statistik, Opgaver til 1. uge

Kommentarer til øvelser i basalkursus, 2. uge

Faculty of Health Sciences. Basal Statistik. Multipel regressionsanalyse. Lene Theil Skovgaard. 8. oktober 2018

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

(tæt på N(0,1) hvis n ikke alt for lille). t i god til at checke for outliers som kan have stor indflydelse på estimaterne s 2 og ˆσ 2 e i

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

To-sidet variansanalyse

Faculty of Health Sciences. Basal Statistik. Multipel regressionsanalyse i R. Lene Theil Skovgaard. 11. marts 2019

Basal Statistik. Multipel lineær regression. Problemstillinger ved multipel regression. Multipel regression. Faculty of Health Sciences

Vejledende besvarelse af hjemmeopgave, efterår 2017

Lineær regression i SAS. Lineær regression i SAS p.1/20

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

SPSS introduktion Om at komme igang 1

Easy Guide i GallupPC

Multipel regression: Et outcome, mange forklarende variable. Eksempel: Ultralydsscanning, umiddelbart inden fødslen (1-3 dage inden)

Hvorfor SAS Kort intro til SAS

Regressionsanalyse i SurveyBanken

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen

Basal statistik. 25. september 2007

Faculty of Health Sciences. Regressionsanalyse. Simpel lineær regression, Lene Theil Skovgaard. Biostatistisk Afdeling

Multipel regression: Et outcome, mange forklarende variable. Eksempel: Ultralydsscanning, umiddelbart inden fødslen (1-3 dage inden)

Regressionsanalyse i SAS

Introduktion til TI-Interactive!

Kort intro til SAS. Efterår Janne Petersen Judith L Jacobsen Lene Theil Skovgaard

Program. 1. Flersidet variansanalyse 1/11

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Opgavebesvarelse, brain weight

Basal statistik. 30. januar 2007

Introduktion til SPSS

APPENDIX A INTRODUKTION TIL DERIVE

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse i R. Lene Theil Skovgaard. 25. februar 2019

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Eksempler med Regression (Se også TilpasFunktion's eksemplet nedenfor)

Statistik i GeoGebra

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Vejledning Brug af Ad hoc analyser

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1 Regressionsproblemet 2

Lineære sammenhænge, residualplot og regression

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Reeksamen i Statistik for Biokemikere 6. april 2009

Statistik (deskriptiv)

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Klasseøvelser dag 2 Opgave 1

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4.

Vejledende besvarelse af hjemmeopgave, efterår 2016

INTRODUKTION TIL dele af SAS

Grupperede observationssæt Deskriptiv statistik: Middelværdi, frekvensfordeling, sumkurve, kvartilsæt, boxplot

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Multipel regression. Birthe Lykke Thomsen H. Lundbeck A/S

Multipel regression 22. Maj, 2012

Modelkontrol i Faktor Modeller

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

Opgavebesvarelse, brain weight

Hurtig gennemgang af indberetningssiden

Phd-kursus i Basal Statistik, Opgaver til 1. uge

Transkript:

Faculty of Health Sciences Basal Statistik - SPSS Multipel regression. Lene Theil Skovgaard 10. oktober 2017 1 / 12

APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Figurer: s. 3, 6, 7, 10, 11 Regressionsanalyse: s. 4, 8, 12 Modelkontrol: s. 5, 6, 7 Prediktion: s. 9, 10 Diagnostics: s. 11, 12 2 / 12

Tredimensionalt plot Slide 7 Benyt Graphs/Graphboard Template Choser, marker de 3 involverede variable (vaegt, bpd og ad) og klik på Scatterplot. For at bytte om på akserne, klikkes på Detailed, hvor man så kan sætte vaegt på Y-aksen, bpd på X-aksen og ad på Z-aksen. 3 / 12

Regressionsanalyse Slide 9 Den minimale opsætning: Benyt Analyze/Regression/Linear Sæt vaegt over i Dependent Sæt både bpd og ad over i Independent(s) Som minimum bør man dog også klikke Statistics og afkrydse Confidence Intervals. Adskillige ekstra options kan tilføjes, som det vil fremgå af nogle af de efterfølgende sider (s. 5, 11, 12) 4 / 12

Modelkontrol Slide 12 Den automatiske modelkontrol i SPSS er ikke særlig god... Brug i stedet nedenstående: I regressionsopsætningen fra s. 4 klikkes på Save, hvorefter man typisk vil vælge Under Predicted Values: vælg Unstandardized, som så kommer til at ligge i datasættet under navnet PRE_1 Under Residuals er der 5 muligheder, f.eks. Unstandardized: De sædvanlige, altså observeret minus forventet, kaldet RES_1 i datasættet Studentized deleted: Normerede Press-residualer (altså hvor den pågældende observation er udeladt ved fit af modellen), kaldet SDR_1 i datasættet 5 / 12

Modelkontrol, II Slide 15-17 Ud fra det udbyggede datasæt dannet s. 5 kan vi nu lave diverse figurer: Benyt Graph/Chart Builder, vælg Scatter, klik Unstandardized Predicted Values over på X-aksen og Unstandardized Residuals over på Y-aksen. Vælg Analyze/Descriptive Statistics/Q-Q Plots og sæt Unstandardized Residuals over i Variables. Benyt Graph/Chart Builder, vælg Histogram og klik det ønskede residual (f.eks. RES_1) ned på X-aksen. Klik så på Distribution Curve og afkryds Normal, klik Apply og Close 6 / 12

Check af varianshomogenitet Slide 18 De standardiserede residualer hedder ZRE_1, og for at definere kvadratroden af de numeriske residualer går vi ind i Transform/Compute, skriver sqrtres i Target Variable og sqrt(abs(zre_1)) i definitionsboksen. Herefter fremstilles figurerne som sædvanligt i Graph/Chart Builder, og ved at dobbeltklikke på grafen efterfølgende, kan man lægge udglattede kurver på ved at klikke på Add Fit Line at Total og derefter i Properties-boksen afkrydse Loess/Apply. 7 / 12

Regressionsanalyse på logaritmer Slide 20 Her skal vi definere logaritmetransformerede variable ved at benytte Transform/Compute, hvor vi først i Target Variable skriver logvaegt og i Numeric Expression skriver Ln(vaegt) Derefter gør vi det igen, men denne gang sætter vi logad som Target Variable, og i Numeric Expression skriver vi Ln(ad/100)/Ln(1.1) Og endelig en sidste gang, hvor vi sætter logbpd som Target Variable, og i Numeric Expression skriver Ln(bpd/90)/Ln(1.1) 8 / 12

Prediktioner til brug for illustrationer Slide 29 9 / 12 Tilføj fiktive personer til datasættet, med manglende værdier af logvaegt, men med de værdier af logbpd og logad (dvs. af bpd og ad), som man gerne vil lave prediktioner for (her 3 værdier af bpd og adskillige af ad) Lav en kolonne, kaldet f.eks. ny, som skal have værdien 0 for alle de oprindelige observationer, men 1 for de nye fiktive Estimer nu i samme model som før i det udbyggede datasæt og gem de predikterede værdier (nu hedder de sikkert PRE_2, fordi vi har gemt nogen tidligere) Transformer de predikterede værdier tilbage til oprindelig skala ved at benytte Tranform/Compute Variable, skriv predikteret i Target Variable og exp(pre_2) i Numeric Expression

Prediktioner til brug for illustrationer, II Slide 30 Selve figurerne dannes således: Begræns data til de fiktive personer ved at gå ind i Data/Selet Cases, klik i If og skrive ny=1 Venstre figur: Gå ind i Graph/Chart Builder, vælg Lines (det til højre, der kan opdeles efter gruppe), og i den fremkomne boks trækkes PRE_2 over på Y-aksen, logad over på X-aksen og bpd over i Set Color Højre figur: Som venstre, blot med predikteret på Y-aksen i stedet for PRE_2, og ad pãě X-aksen i stedet for logad 10 / 12

Regression diagnostics Slide 32 Vi anvender her igen Save-knappen i regressionsopsætningen (se s. 4 og evt. 5), og krydser det af, vi gerne vil bruge, nemlig Cook s og under Influence Statistics: Standardized DfBetas (og evt. også DfBetas(s)) Herefter benyttes Graph/Chart builder/scatter som tidligere. 11 / 12

Variabelselektion og flere options Slide 52 I regressionsopsætningen (se s. 4) klikkes på Method, der nu kan skiftes fra Enter ( den kontrollerede og anbefalede metode ) til Backward eller Forward Slide 66 I regressionsopsætningen (se s. 4) klikkes på Statistics, hvor man kan vælge Collinearity Diagnostics 12 / 12