Introduktion til R. Faculty of Health Sciences
|
|
|
- Bertram Lund
- 10 år siden
- Visninger:
Transkript
1 Faculty of Health Sciences Introduktion til R Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Kursushjemmeside:
2 Statistikprogrammer De mest kendte / udbredte er SAS. Få har adgang til SAS (indenfor RH/regionH). SPSS. De fleste har adgang til SPSS, men man kan hurtigt komme til kort med standardversionen. Stata. R. Excel (kan meget lidt). 2 / 31
3 Hvorfor R? Fordele: 3 / 31 R er gratis. R er et open-source program. Vedligeholdes af en stor gruppe internationale forskere og opdateres løbende. Alle har mulighed for at lave pakker indeholdende specialfunktioner. Derfor er R hurtigere up-to-date og har i nogle tilfælde flere muligheder end kommercielle programmer. Flexibelt. Funktioner og kommandoer kan kombineres til nye funktioner og kommandoer. Grafik. Let at lave flotte grafer. Stor flexibilitet. Let at finde pakker og dokumentation på nettet. Kan man ikke selv løse sit problem findes R-help mailing liste (se
4 Hvorfor fravælge R? Ulemper: Nogle funktioner kan være langsomme. Meget store datasæt går ikke (registerdata). Ikke altid veldokumenteret. Fejlmeddelelser kan være svære at forstå. Programmering i stedet for peg-og-klik (måske i virkeligheden en fordel). Der findes dog en brugervenlig grænseflade, R Commander, til det mest basale. 4 / 31
5 At komme i gang med R R kan downloades fra Installerer næsten sig selv. Lær mere om R: Peter Dalgaard: Introductory Statistics with R. En letlæselig introduktion til R er kapitel 1 i Applied R for the quantitative social scientist af R. Nieuwenhuis som kan hentes fra Læs dette kapitel til næste gang. Prøv evt selv at google Introduction to R ( resultater!). 5 / 31
6 Hvordan arbejde med R? 6 / 31 R består af en konsol, hvor man kan skrive kommandoer og hvor output vises (avanceret lommeregner). Til at holde styr på og gemme kommandoer anbefales det at arbejde i et script -vindue Et script er en samling af kommandoer. Et nyt script laves via File-menuen -> New script. Scripts kan gemmes og åbnes gennem File-menuen. Ved markering af linier / kommandoer efterfulgt af Crtl+R kopieres disse linier til konsolvinduet og eksekveres. R ignorerer al tekst efter en # (nyttigt til forklaringer i scriptet). I konsolvinduet vises kommandoer i rødt, output i blåt. Bemærk: Hvis R går ned går scriptvinduet også ned - husk derfor at gemme regelmæssigt!
7 R som lommeregner R har alle standard funktioner indbygget: 3+2 3*2 3^2 log(3) pi cos(3) R skelner mellem store og små bogstaver. Pil op-tasten genkalder forrige kommando. R afsluttes med q(). Man kan da vælge at gemme alt i hukommelsen. Det kan hentes frem næste gang R åbnes under File -> Load workspace... 7 / 31
8 Variable og hukommelse Variable (objekter): Tal, data, output, etc. kan gemmes i hukommelsen ved <-. Eksempler: x <- c(1, 2, 3) y <- c(4, 5, 6) x + y # viser summen z <- x + y # gemmer summen i z z # viser z frugt<-c("banan","appelsin") frugt Hukommelse: Kommandoen ls() viser alle variable i hukommelsen. Variable kan slettes med rm(), e.g. rm(x,y) 8 / 31
9 Datastrukturer En vektor er en liste af elementer, f.eks. x<-1:10 y<-seq(1,5,by=1) Vi kan udvælge en del af en vektor med []: x[1] x[1:5] x[y] En matrix er en todimensionel liste, f.eks. a<-matrix(1:10,ncol=5,nrow=2,byrow=false) b<-matrix(1:10,ncol=5,nrow=2,byrow=true) Vi kan udvælge en del af matricen med []: a[1,1] a[2,4:5] 9 / 31
10 Datasæt Datasæt i R gemmes i en data frame: x1<-1:10 y1<-5*10:1 z1<-c(rep("pige",3),rep("dreng",7)) data<-data.frame(x1,y1,z1) Vi kan hente variablene i data framen: names(data) # hvad er variabelnavnene? head(data) # viser de foerste 6 linier tail(data) # viser de sidste 6 linier data$x1 data[,1] rm(x1,y1,z1) # sletter variable - nu ligger de i data x1 Vi kan gøre variablene i data framen globale: attach(data) x1 og fjerne dem fra hukommelsen igen: detach(data) x1 10 / 31
11 Omkodning af variable Vi kan regne videre på variable og definere nye: attach(data) w1<-x1+1.2*y1 w1 w1+z1 w1<-w1+1 Logiske operatorer &! og eller ej Relationer ==!= < <= > >= ens foskellig Vi kan vælge elementer ud which(y1>15) y1[y1>15]<-7 y1 11 / 31
12 Funktioner Vi kan regne videre på variable/objekter: x<-1:10 mean(x) sum(x) median(x) Nogle funktioner kræver flere argumenter: # Generer 100 observationer fra en standard normalfordeling w<-rnorm(100,0,1) Det er vigtigt at argumenterne optræder i den rigtige rækkefølge. Alternativt kan man specificere argumenterne w<-rnorm(n=100,mean=0,sd=1) og rækkefølgen er ligegyldig. Hvordan finder man ud af syntaksen? I konsollen tastes help(rnorm) eller args(rnorm). Hvordan finder man overhovedet funktionen? 12 / 31 Google! Evt R-commander.
13 R commander Der findes en peg-og-klik-pakke til R : R commander. Denne indeholder de mest basale metoder, men der findes også ekstra pakker (plug-ins) som giver adgang til andre metoder. Vi vil generelt fokusere på selv at skrive koden (pga. fleksibilitet), men I vil også få en kort introduktion til R commander. 13 / 31
14 Installering af pakker Kan enten gøres via menuen Packages -> Install Package(s)... eller ved kommandoen install.packages. Eksempel: Installering af R commander: install.packages("rcmdr") install.packages("rcmdrplugin.survival") Aktivering af installerede pakker: library(rcmdrplugin.survival) Pakkerne skal aktiveres hver gang R åbnes, men skal kun installeres en gang. 14 / 31
15 Hvordan ser et R-datasæt ud? En linie pr individ: time event female logwbc placebo Rækker repræsenterer individer. Søjler repræsenterer variable (værdier). Manglende værdier repræsenteres med NA (Not Available). 15 / 31
16 Indlæsning af data Tekstfiler: Første række indeholder ofte variabelnavne. Søjlerne er adskilt af en indikator (, ; mellemrum tab). Indlæses i R med read.table(), read.csv(), read.delim(): Det er nyttigt at oprette et arbejdskatalog til sine filer: setwd("c:/xxx") (set working directory). Se indholdet af kataloget med dir(). data<-read.table("filnavn") # Kommasepareret fil data<-read.csv("filnavn") data<-read.table("filnavn",header=true, sep=",") # Tabulatorsepareret fil data<-read.delim("filnavn") data<-read.table("filnavn",header=true, sep="\t") 16 / 31
17 Datafiler kan i Excel gemmes i csv-format. Datafiler fra andre statistikprogrammer kan læses ind ved: library(foreign) data<-read.spss("filnavn") data<-read.dta("filnavn") # Stata-filer At indlæse data fra SAS kræver lidt krumspring. Ændring / tilføjelse af variabelnavne names(data) names(data)<-c("a","b","d") 17 / 31
18 Overlevelsesanalyse i R Overlevelsesanalyse i R laves med pakken survival. Denne pakke er en del af standardinstallationen, men skal stadig aktiveres med library(survival). Vi får brug for følgende funktioner: Surv : Laver survivalobjekter (=responsen). survfit : Estimerer KM-kurver. summary : Giver et print af KM-kurver. survdiff : Udfører LogRank-test. plot : Plotter KM-kurver. 18 / 31
19 Survivalobjekter Funktionerne i survival arbejder med survivalobjekter, som kombinerer levetiderne med censureringsoplysningerne. Survivalobjekter dannes med funktionen Surv og bruger to argumenter, Surv(time,event): time : Navnet på variablen med follow-up tid event : Status indikator event=true eller event=1 hvis observeret levetid event=false eller event=0 hvis censureret levetid. Survivalobjektet er responsen og bruges alene i andre funktioner. 19 / 31
20 surv > rdata<-read.table("c:/documents and Settings/Rdata/remissionData.dat > library(survival) header=t,sep=";") > head(rdata) time failure sex logwbc placebo > rdata.treatment<-subset(rdata,placebo==0) > attach(rdata.treatment) > surv.treatment<-surv(time,event=failure) > surv.treatment [1] [20] 6 6 > > detach(rdata.treatment) 20 / 31
21 Kaplan-Meier estimatoren KM-estimatoren beregnes vha funktionen survfit > KM.treatment<-survfit(surv.treatment~1) > KM.treatment Call: survfit(formula = surv.treatment ~ 1) records n.max n.start events median 0.95LCL 0.95UCL NA Her angiver 1 at vi vil have én KM-kurve baseret på alle patienterne (svarende til en gruppe). 21 / 31
22 Selve KM-estimaterne får vi ud vha summary: > summary(km.treatment) Call: survfit(formula = surv.treatment ~ 1) time n.risk n.event survival std.err lower 95% CI upper 95% CI / 31
23 Et plot af Kaplan-Meier estimatoren > plot(km.treatment) Plot uden konfidensintervaller og censureringsmærker: plot(km.treatment,conf.int=f,mark.time=f) 23 / 31
24 At gemme et plot i R Et plot kan gemmes på flere måder: Højreklik på grafen. Der er mulighed for at gemme som postscript eller meta-fil. Som pdf. Før plot-koden anvendes kommandoen pdf( filnavn.pdf ). Plottet afsluttes med dev.off(). Eksempel: pdf("kmplot.pdf") plot(km.treatment) dev.off() Der findes også andre formater - brug google for at finde dem. 24 / 31
25 KM estimater for begge grupper på en gang Igen benyttes Surv sammen med survfit: > attach(rdata) > KM.byTreatment<-survfit(Surv(time,event=failure)~placebo) > KM.byTreatment Call: survfit(formula = Surv(time, event = failure) ~ placebo) records n.max n.start events median 0.95LCL 0.95UCL placebo= NA placebo= Her angiver ~placebo at KM-kurverne skal laves separat for hver behandlingsgruppe. 25 / 31
26 > summary(km.bytreatment) Call: survfit(formula = Surv(time, event = failure) ~ placebo) placebo=0 time n.risk n.event survival std.err lower 95% CI upper 95% CI placebo=1 time n.risk n.event survival std.err lower 95% CI upper 95% CI NaN NA NA 26 / 31
27 Et plot af KM opdelt på behandlingsgruppe plot(km.bytreatment,xlab="tid (uger)",lty=1:2, col=c("black","grey"),lwd=2) legend(25, 1, c("behandling","placebo"),lty = 1:2, lwd=2, col=c("black","grey")) title("km-kurver for remissionsdata") Her er xlab=x-axis label, lty=line type, lwd=line width, col=color. KM kurver for remissionsdata Behandling Placebo Tid (uger) 27 / 31
28 LogRank-testet Sammenligning af placebo- med behandlingsgruppen foretages vha survdiff: > survdiff(surv(time,event=failure)~placebo) Call: survdiff(formula = Surv(time, event = failure) ~ placebo) N Observed Expected (O-E)^2/E (O-E)^2/V placebo= placebo= Chisq= 16.8 on 1 degrees of freedom, p= 4.17e / 31
29 Øvelser I må gerne forsøge at bruge R commander. Hvis, så kig på den kode der genereres og prøv at forstå den. Lidt indledende gymnastik i R: 1. Indlæs remissionsdata fra Excel-filen remissiondata.xls på kursushjemmesiden. 2. Lav et histogram af logwbc. 3. Beregn median, gennemsnit og standardafvigelse for logwbc. Beregn selv et 95%-konfidensinterval for middelværdien. 4. Hvordan er fordelingen af køn? (Lav en tabel med table). 5. Hvordan er fordelingen af køn på de to behandlinger? Er der forskel på antallet af kvinder i de to grupper? (Lav et χ 2 -test). 6. Sammenlign logwbc for placebogruppen med logwbc for behandlingsgruppen - er der forskel? Er det vigtigt? 29 / 31
30 Overlevelsesanalyse i R: Remissionsdata: 1. Genskab KM-kurven for hver behandlingsgruppe for sig. Tilføj et 95%-konfidensinterval baseret på log(-log)-transformationen. 2. Genskab plottet indeholdende begge KM-kurver. 3. Udfør LogRank-testet. 4. Sammenlign mænd og kvinder mht. overlevelse. 5. Lav en ny variabel, som inddeler logwbc i høj / lav. Er der forskel på overlevelsen i disse to grupper? Lav en tilsvarende undersøgelse, hvor logwbc er inddelt i tre grupper lav / mellem / høj. Hvad ser vi? 30 / 31
31 Maligne melanomer: 1. Et datasæt om maligne melanomer er tilgængeligt i pakken timereg. Installér og aktivér pakken. Datasættet melanoma gøres tilgængeligt med kommandoen data(melanoma). 2. Dan et overblik over data med tabeller og histogrammer. Prøv at finde info på nettet om dette datasæt - hvordan skal status-variablen forstås? 3. Vi vil fokusere på død pga melanomer, dvs. død af andre årsager skal betragtes som censurering. Er der forskel på risikoen for død af maligne melanomer for mænd og kvinder? Hvori består forskellen? 4. Undersøg om andre variable kan have en betydning. 31 / 31
Introduktion til overlevelsesanalyse
Faculty of Health Sciences Introduktion til overlevelsesanalyse Kaplan-Meier estimatoren Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected]
Introduktion til overlevelsesanalyse
Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Kursushjemmeside:
Introduktion til SPSS
Introduktion til SPSS Øvelserne på dette statistikkursus skal gennemføres ved hjælp af det såkaldte SPSS program. Det er erfaringsmæssigt sådan, at man i forbindelse af øvelserne på statistikkurser bruger
Lineær og logistisk regression
Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Dagens program Lineær regression
Overlevelsesanalyse. Faculty of Health Sciences
Faculty of Health Sciences Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Program Overlevelsesdata Kaplan-Meier estimatoren
Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver
Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2 Københavns Universitet Susanne Ditlevsen og Helle Sørensen R opgaver Det er en god ide at vænne sig til at skrive kommandoerne i en editor
Introduktion til overlevelsesanalyse
Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression III Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Kursushjemmeside:
1 Start og afslutning. Help.
Afdeling for Teoretisk Statistik STATISTIK 2 Institut for Matematiske Fag Jørgen Granfeldt Aarhus Universitet 24. september 2003 Hermed en udvidet udgave af Jens Ledet Jensens introduktion til R. 1 Start
Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.
Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i
HOFTEALLOPLASTIK - DATAUDTRÆK OG IMPORT TIL EXCEL
HOFTEALLOPLASTIK - DATAUDTRÆK OG IMPORT TIL EXCEL Når man er logget på KMS systemet, vælges Dataudtræk under punktet Vælg modul, hvorefter der klikkes på Gå til: På næste side klikkes på knappen Opret:
Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable
Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Sammenhæng
Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.
1 Levetidsanalyse Overlevelsesfunktionen Censurering Kaplan-Meier estimatoren Hazard funktionen Proportionale hazards Multipel regression PSE (I17) FSV1 Statistik - 5. lektion 1 / 19 Overlevelsesfunktionen
R / RStudio. Intro til R / RStudio
R / RStudio Intro til R / RStudio R R er et open source statstikprogram og programmeringssprog introduceret i 1993. Seneste version er 2.15.3 R kan downloades på www.r-project.org R er i udgangspunktet
Introduktion til overlevelsesanalyse
Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression II Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Kursushjemmeside:
Indledning. På de følgende sider vises, primært i tegneserieform, lidt om mulighederne i PC-AXIS for Windows.
Indledning PC-AXIS for Windows er et talbehandlingsprogram, der kan håndtere store mængder statistisk materiale. PC-AXIS giver mulighed for at arbejde videre med det statistiske materiale i egne programmer
Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test
Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Formålet med øvelsen er at analysere risikoen for død forbundet med forskelligt alkoholforbrug. I denne øvelse skal analyserne foretages
Dag 6: Interaktion. Overlevelsesanalyse
Dag 6: Interaktion. Overlevelsesanalyse How does CHD depend on gender and hypertension? Males: hypertension chd01 Females: Frequency Row Pct 0 1 Total ---------+--------+--------+ 0 352 95 447 78.75 21.25
Statistik i GeoGebra
Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik
Kort intro til SAS. Efterår 2015. Janne Petersen Judith L Jacobsen Lene Theil Skovgaard
Kort intro til SAS Efterår 2015 Janne Petersen Judith L Jacobsen Lene Theil Skovgaard 1 Hvorfor SAS Kan alt Alle ph.d. studerende har gratis adgang Fra universitetet eller hospitalerne Kode --- hjælp fra
Statistik FSV 4. semester 2014 Holdundervisning Uge 1: 4. februar Introduktion til Stata
Århus 27. januar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Holdundervisning Uge 1: 4. februar Introduktion til Stata Hvad er Stata? Stata er et program, der kan lave statistiske analyser af
Program dag 2 (11. april 2011)
Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge;
Klargøring af data til aflevering til DDA. Instruks
v Klargøring af data til aflevering til DDA Instruks Denne instruks gennemgår datadokumentationsformater m.v. for datasystemfiler, som skal afleveres til Dansk Data Arkiv efter indgået aftale om ekstern
Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner
Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Indledning... 1 Hukommelse... 1 Simple beskrivelser... 1 Data manipulation... 2 Estimation af proportioner... 2 Estimation af rater... 2 Estimation
Statistik kommandoer i Stata opdateret 22/ Erik Parner
Statistik kommandoer i Stata opdateret 22/4 2008 Erik Parner Indledning... 1 Simple beskrivelser... 1 Data manipulation... 1 Estimation af proportioner... 2 Estimation af rater... 2 Estimation af Relativ
Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
MPH specialmodul Epidemiologi og Biostatistik
MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:
Stastistik og Databehandling på en TI-83
Stastistik og Databehandling på en TI-83 Af Jonas L. Jensen ([email protected]). 1 Fordelingsfunktioner Husk på, at en fordelingsfunktion for en stokastisk variabel X er funktionen F X (t) = P (X t) og at
Statistiske Modeller 1: Kontingenstabeller i SAS
Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.
Kom godt i gang med I-bogen
Kom godt i gang med I-bogen At åbne bogen Det allerførste, du skal gøre, for at kunne arbejde med i-bogen, er at aktivere den. Det gøres ved at oprette en konto på systime.dk og derefter aktivere bogen
Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018
Faculty of Health Sciences Basal Statistik Overlevelsesanalyse Lene Theil Skovgaard 12. marts 2018 1 / 12 APPENDIX vedr. SPSS svarende til diverse slides: Kaplan-Meier kurver, s. 3 Kumulerede incidenser
Hvorfor SAS Kort intro til SAS
Hvorfor SAS Kort intro til SAS Efterår 2015 Janne Petersen Judith L Jacobsen Lene Theil Skovgaard Kan alt Alle ph.d. studerende har gratis adgang Fra universitetet eller hospitalerne Kode --- hjælp fra
Basal Statistik - SPSS
Faculty of Health Sciences Basal Statistik - SPSS Begreber. Parrede sammenligninger. Lene Theil Skovgaard 5. september 2017 1 / 16 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides
SAS formater i Danmarks Statistik
Danmarks Statistik, Forskningsservice og Kundecenter 9. januar 2012 SAS formater i Danmarks Statistik 1. Indledning... 1 2. Hvor findes formater og øvrige datafiler?... 2 3. Hvordan bruges formater i SAS-programmet?...
Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar
Århus 6. februar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Til disse øvelser har I brug for fishoil1.dta, der indeholder data fra det fiskeolie forsøg vi så på ved
Introduktion til MatLab Matematisk Modellering af Dynamiske Modeller ved Kasper Bjering Jensen, RUC, februar 2010
Introduktion til MatLab Matematisk Modellering af Dynamiske Modeller ved Kasper Bjering Jensen, RUC, februar 2010 Computere er uvurderlige redskaber for personer der ønsker at arbejde med matematiske modeller
Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Forelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Basal Statistik - SPSS
Faculty of Health Sciences Basal Statistik - SPSS Regressionsanalyse. Lene Theil Skovgaard 5. februar 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Indlæsning og
Fagets IT Introduktion til MATLAB
Fagets IT Introduktion til MATLAB Mads G. Christensen [email protected] Afdeling for Kommunikationsteknologi, Aalborg Universitet. MATLAB 2002 p.1/28 Kursusoversigt 1. Introduktion, matrix-indeksering, -operationer
GIS. Guide til indlæsning af data i ArcGIS herunder KMS-data fra internettet
GIS Af Anders Bartholdy Guide til indlæsning af data i ArcGIS herunder KMS-data fra internettet Baggrundskort fra KMS er en rigtig god resurse der er tilgængelig via ArcGIS. Derfor starter vi med at gennemgå
Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1
Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen
Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved
Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,
Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016
Faculty of Health Sciences Basal Statistik Begreber. Parrede sammenligninger. Lene Theil Skovgaard 6. september 2016 1 / 88 APPENDIX Programbidder svarende til diverse slides: Indlæsning af vitamin D datasæt,
SÅDAN BRUGER DU REGNEARK INTRODUKTION
SÅDAN BRUGER DU REGNEARK INTRODUKTION I vejledningen bruger vi det gratis program Calc fra OpenOffice som eksempel til at vise, hvordan man bruger nogle helt grundlæggende funktioner i regneark. De øvrige
Morten Frydenberg 14. marts 2006
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen
Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.
Faculty of Health Sciences SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 22. januar 2018 1 / 20 SPSS APPENDIX med instruktioner til SPSS-analyse svarende
Introduktion Indtastning Funktioner Scripts Optimering. Matlab
- [email protected] http://www.math.aau.dk/ robert/teaching/2010/matlab 9. august 2010 1/39 Disposition 1. Lidt om. 2. Basiskursus. 3. Opgaver. 4. Mere til basiskursus. 5. Opgaver. 2/39 MATLAB = MATrix
Morten Frydenberg 26. april 2004
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.
Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje.
Maple Dette kapitel giver en kort introduktion til hvordan Maple 12 kan benyttes til at løse mange af de opgaver, som man bliver mødt med i matematiktimerne på HHX. Skærmbilledet Vi starter med at se lidt
Løsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Fable Kom godt i gang
Fable Kom godt i gang Opdateret: 26-03-2018 Indholdsfortegnelse 1. Først skal du installere programmet på din computer 3 2. Når programmet er installeret er du klar til at pakke robotten ud 4 3. Nu er
Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen
Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk
02101 Indledende Programmering Introduktion til Eclipse
02101 Indledende Programmering Introduktion til Eclipse Version 2018 1 Introduktion I dette kursus lægger vi op til at man bruger det integrerede udviklingsmiljø Eclipse. Basalt set er et integreret udviklingsmiljø
Multipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
R E D C A P M A N U A L. Importér data til REDCap fra CSV-fil. Opbyg din eksisterende database i REDCap Version 1.0
R E D C A P M A N U A L Importér data til REDCap fra CSV-fil Opbyg din eksisterende database i REDCap Version 1.0 Introduktion Der opstår ofte et ønske om at importere data fra andre databaser til REDCap,
MSI pakke til distribution af AutoPilot komponenter.
MSI pakke til distribution af AutoPilot komponenter. Hermed følger en basal dokumentation for installation af AutoPilot msi pakken. Der vil i det følgende blive forklaret brugen af 4 programmer fra Microsoft,
Statistik for Biokemikere Projekt
Statistik for Biokemikere Projekt Institut for Matematiske Fag Inge Henningsen og Helle Sørensen Københavns Universitet November 2008 Formalia Dette projekt udgør en del af evalueringen i kurset Statistik
Kom godt i gang med Fable-robotten
Kom godt i gang med Fable-robotten 1. Først skal du installere programmet på din computer. Gå ind på shaperobotics.com og under support vælger du download: Her vælger du, under PC App om du kører Windows
Indstillinger. 1. Built-in viewer 2. Built-in viewer embedded 3. Ekstern viewer
TeXMaker guide TeXMaker er den editor, som vi anbefaler til at skrive LaTeX i. Det er en såkaldt cross-platform editor og kan benyttes til både Windows, Mac og Linux. TeXMaker er en ret almindelig editor
MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom.
MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom. For at I skal kunne regne på tallene fra undersøgelsen har vi taget en delmængde af variablene
Vejledning til opbygning af hjemmesider
Side 1 af 9 Vejledning til opbygning af hjemmesider Hvis du er inde på din klubs hjemmeside, fx på forsiden, kan du nu gå i gang med at redigere. For at få redigeringsværktøjet frem, skal du klikke på
Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.
1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;
Analyse af binære responsvariable
Analyse af binære responsvariable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet 23. november 2012 Har mænd lettere ved at komme ind på Berkeley? UC Berkeley
Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale
Produkt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:
1 IHD-Lexis 1.1 Spørgsmål 1 Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: data ihdfreq; input eksp alder pyrs cases; lpyrs=log(pyrs); cards; 0 2 346.87 2 0 1 979.34 12 0 0 699.14
Simpel Lineær Regression
Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige
Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration
Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: [email protected] Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion
Løsning til opgave i logistisk regression
Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator
KORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER
ANALYSERAPPORT KORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER Denne rapport samt bilag indeholder den endelige database af spørgeskemaet Anvendelsen af digitale ressourcer
Morten Frydenberg Biostatistik version dato:
Caerphilly studiet Design og Data Biostatistik uge 14 mandag Morten Frydenberg, Afdeling for Biostatistik Poisson regression En primær tidsakse og ikke stykkevise konstante rater Cox proportional hazard
Modelkontrol i Faktor Modeller
Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk
