Introduktion til R. Faculty of Health Sciences
|
|
- Bertram Lund
- 8 år siden
- Visninger:
Transkript
1 Faculty of Health Sciences Introduktion til R Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:
2 Statistikprogrammer De mest kendte / udbredte er SAS. Få har adgang til SAS (indenfor RH/regionH). SPSS. De fleste har adgang til SPSS, men man kan hurtigt komme til kort med standardversionen. Stata. R. Excel (kan meget lidt). 2 / 31
3 Hvorfor R? Fordele: 3 / 31 R er gratis. R er et open-source program. Vedligeholdes af en stor gruppe internationale forskere og opdateres løbende. Alle har mulighed for at lave pakker indeholdende specialfunktioner. Derfor er R hurtigere up-to-date og har i nogle tilfælde flere muligheder end kommercielle programmer. Flexibelt. Funktioner og kommandoer kan kombineres til nye funktioner og kommandoer. Grafik. Let at lave flotte grafer. Stor flexibilitet. Let at finde pakker og dokumentation på nettet. Kan man ikke selv løse sit problem findes R-help mailing liste (se
4 Hvorfor fravælge R? Ulemper: Nogle funktioner kan være langsomme. Meget store datasæt går ikke (registerdata). Ikke altid veldokumenteret. Fejlmeddelelser kan være svære at forstå. Programmering i stedet for peg-og-klik (måske i virkeligheden en fordel). Der findes dog en brugervenlig grænseflade, R Commander, til det mest basale. 4 / 31
5 At komme i gang med R R kan downloades fra Installerer næsten sig selv. Lær mere om R: Peter Dalgaard: Introductory Statistics with R. En letlæselig introduktion til R er kapitel 1 i Applied R for the quantitative social scientist af R. Nieuwenhuis som kan hentes fra Læs dette kapitel til næste gang. Prøv evt selv at google Introduction to R ( resultater!). 5 / 31
6 Hvordan arbejde med R? 6 / 31 R består af en konsol, hvor man kan skrive kommandoer og hvor output vises (avanceret lommeregner). Til at holde styr på og gemme kommandoer anbefales det at arbejde i et script -vindue Et script er en samling af kommandoer. Et nyt script laves via File-menuen -> New script. Scripts kan gemmes og åbnes gennem File-menuen. Ved markering af linier / kommandoer efterfulgt af Crtl+R kopieres disse linier til konsolvinduet og eksekveres. R ignorerer al tekst efter en # (nyttigt til forklaringer i scriptet). I konsolvinduet vises kommandoer i rødt, output i blåt. Bemærk: Hvis R går ned går scriptvinduet også ned - husk derfor at gemme regelmæssigt!
7 R som lommeregner R har alle standard funktioner indbygget: 3+2 3*2 3^2 log(3) pi cos(3) R skelner mellem store og små bogstaver. Pil op-tasten genkalder forrige kommando. R afsluttes med q(). Man kan da vælge at gemme alt i hukommelsen. Det kan hentes frem næste gang R åbnes under File -> Load workspace... 7 / 31
8 Variable og hukommelse Variable (objekter): Tal, data, output, etc. kan gemmes i hukommelsen ved <-. Eksempler: x <- c(1, 2, 3) y <- c(4, 5, 6) x + y # viser summen z <- x + y # gemmer summen i z z # viser z frugt<-c("banan","appelsin") frugt Hukommelse: Kommandoen ls() viser alle variable i hukommelsen. Variable kan slettes med rm(), e.g. rm(x,y) 8 / 31
9 Datastrukturer En vektor er en liste af elementer, f.eks. x<-1:10 y<-seq(1,5,by=1) Vi kan udvælge en del af en vektor med []: x[1] x[1:5] x[y] En matrix er en todimensionel liste, f.eks. a<-matrix(1:10,ncol=5,nrow=2,byrow=false) b<-matrix(1:10,ncol=5,nrow=2,byrow=true) Vi kan udvælge en del af matricen med []: a[1,1] a[2,4:5] 9 / 31
10 Datasæt Datasæt i R gemmes i en data frame: x1<-1:10 y1<-5*10:1 z1<-c(rep("pige",3),rep("dreng",7)) data<-data.frame(x1,y1,z1) Vi kan hente variablene i data framen: names(data) # hvad er variabelnavnene? head(data) # viser de foerste 6 linier tail(data) # viser de sidste 6 linier data$x1 data[,1] rm(x1,y1,z1) # sletter variable - nu ligger de i data x1 Vi kan gøre variablene i data framen globale: attach(data) x1 og fjerne dem fra hukommelsen igen: detach(data) x1 10 / 31
11 Omkodning af variable Vi kan regne videre på variable og definere nye: attach(data) w1<-x1+1.2*y1 w1 w1+z1 w1<-w1+1 Logiske operatorer &! og eller ej Relationer ==!= < <= > >= ens foskellig Vi kan vælge elementer ud which(y1>15) y1[y1>15]<-7 y1 11 / 31
12 Funktioner Vi kan regne videre på variable/objekter: x<-1:10 mean(x) sum(x) median(x) Nogle funktioner kræver flere argumenter: # Generer 100 observationer fra en standard normalfordeling w<-rnorm(100,0,1) Det er vigtigt at argumenterne optræder i den rigtige rækkefølge. Alternativt kan man specificere argumenterne w<-rnorm(n=100,mean=0,sd=1) og rækkefølgen er ligegyldig. Hvordan finder man ud af syntaksen? I konsollen tastes help(rnorm) eller args(rnorm). Hvordan finder man overhovedet funktionen? 12 / 31 Google! Evt R-commander.
13 R commander Der findes en peg-og-klik-pakke til R : R commander. Denne indeholder de mest basale metoder, men der findes også ekstra pakker (plug-ins) som giver adgang til andre metoder. Vi vil generelt fokusere på selv at skrive koden (pga. fleksibilitet), men I vil også få en kort introduktion til R commander. 13 / 31
14 Installering af pakker Kan enten gøres via menuen Packages -> Install Package(s)... eller ved kommandoen install.packages. Eksempel: Installering af R commander: install.packages("rcmdr") install.packages("rcmdrplugin.survival") Aktivering af installerede pakker: library(rcmdrplugin.survival) Pakkerne skal aktiveres hver gang R åbnes, men skal kun installeres en gang. 14 / 31
15 Hvordan ser et R-datasæt ud? En linie pr individ: time event female logwbc placebo Rækker repræsenterer individer. Søjler repræsenterer variable (værdier). Manglende værdier repræsenteres med NA (Not Available). 15 / 31
16 Indlæsning af data Tekstfiler: Første række indeholder ofte variabelnavne. Søjlerne er adskilt af en indikator (, ; mellemrum tab). Indlæses i R med read.table(), read.csv(), read.delim(): Det er nyttigt at oprette et arbejdskatalog til sine filer: setwd("c:/xxx") (set working directory). Se indholdet af kataloget med dir(). data<-read.table("filnavn") # Kommasepareret fil data<-read.csv("filnavn") data<-read.table("filnavn",header=true, sep=",") # Tabulatorsepareret fil data<-read.delim("filnavn") data<-read.table("filnavn",header=true, sep="\t") 16 / 31
17 Datafiler kan i Excel gemmes i csv-format. Datafiler fra andre statistikprogrammer kan læses ind ved: library(foreign) data<-read.spss("filnavn") data<-read.dta("filnavn") # Stata-filer At indlæse data fra SAS kræver lidt krumspring. Ændring / tilføjelse af variabelnavne names(data) names(data)<-c("a","b","d") 17 / 31
18 Overlevelsesanalyse i R Overlevelsesanalyse i R laves med pakken survival. Denne pakke er en del af standardinstallationen, men skal stadig aktiveres med library(survival). Vi får brug for følgende funktioner: Surv : Laver survivalobjekter (=responsen). survfit : Estimerer KM-kurver. summary : Giver et print af KM-kurver. survdiff : Udfører LogRank-test. plot : Plotter KM-kurver. 18 / 31
19 Survivalobjekter Funktionerne i survival arbejder med survivalobjekter, som kombinerer levetiderne med censureringsoplysningerne. Survivalobjekter dannes med funktionen Surv og bruger to argumenter, Surv(time,event): time : Navnet på variablen med follow-up tid event : Status indikator event=true eller event=1 hvis observeret levetid event=false eller event=0 hvis censureret levetid. Survivalobjektet er responsen og bruges alene i andre funktioner. 19 / 31
20 surv > rdata<-read.table("c:/documents and Settings/Rdata/remissionData.dat > library(survival) header=t,sep=";") > head(rdata) time failure sex logwbc placebo > rdata.treatment<-subset(rdata,placebo==0) > attach(rdata.treatment) > surv.treatment<-surv(time,event=failure) > surv.treatment [1] [20] 6 6 > > detach(rdata.treatment) 20 / 31
21 Kaplan-Meier estimatoren KM-estimatoren beregnes vha funktionen survfit > KM.treatment<-survfit(surv.treatment~1) > KM.treatment Call: survfit(formula = surv.treatment ~ 1) records n.max n.start events median 0.95LCL 0.95UCL NA Her angiver 1 at vi vil have én KM-kurve baseret på alle patienterne (svarende til en gruppe). 21 / 31
22 Selve KM-estimaterne får vi ud vha summary: > summary(km.treatment) Call: survfit(formula = surv.treatment ~ 1) time n.risk n.event survival std.err lower 95% CI upper 95% CI / 31
23 Et plot af Kaplan-Meier estimatoren > plot(km.treatment) Plot uden konfidensintervaller og censureringsmærker: plot(km.treatment,conf.int=f,mark.time=f) 23 / 31
24 At gemme et plot i R Et plot kan gemmes på flere måder: Højreklik på grafen. Der er mulighed for at gemme som postscript eller meta-fil. Som pdf. Før plot-koden anvendes kommandoen pdf( filnavn.pdf ). Plottet afsluttes med dev.off(). Eksempel: pdf("kmplot.pdf") plot(km.treatment) dev.off() Der findes også andre formater - brug google for at finde dem. 24 / 31
25 KM estimater for begge grupper på en gang Igen benyttes Surv sammen med survfit: > attach(rdata) > KM.byTreatment<-survfit(Surv(time,event=failure)~placebo) > KM.byTreatment Call: survfit(formula = Surv(time, event = failure) ~ placebo) records n.max n.start events median 0.95LCL 0.95UCL placebo= NA placebo= Her angiver ~placebo at KM-kurverne skal laves separat for hver behandlingsgruppe. 25 / 31
26 > summary(km.bytreatment) Call: survfit(formula = Surv(time, event = failure) ~ placebo) placebo=0 time n.risk n.event survival std.err lower 95% CI upper 95% CI placebo=1 time n.risk n.event survival std.err lower 95% CI upper 95% CI NaN NA NA 26 / 31
27 Et plot af KM opdelt på behandlingsgruppe plot(km.bytreatment,xlab="tid (uger)",lty=1:2, col=c("black","grey"),lwd=2) legend(25, 1, c("behandling","placebo"),lty = 1:2, lwd=2, col=c("black","grey")) title("km-kurver for remissionsdata") Her er xlab=x-axis label, lty=line type, lwd=line width, col=color. KM kurver for remissionsdata Behandling Placebo Tid (uger) 27 / 31
28 LogRank-testet Sammenligning af placebo- med behandlingsgruppen foretages vha survdiff: > survdiff(surv(time,event=failure)~placebo) Call: survdiff(formula = Surv(time, event = failure) ~ placebo) N Observed Expected (O-E)^2/E (O-E)^2/V placebo= placebo= Chisq= 16.8 on 1 degrees of freedom, p= 4.17e / 31
29 Øvelser I må gerne forsøge at bruge R commander. Hvis, så kig på den kode der genereres og prøv at forstå den. Lidt indledende gymnastik i R: 1. Indlæs remissionsdata fra Excel-filen remissiondata.xls på kursushjemmesiden. 2. Lav et histogram af logwbc. 3. Beregn median, gennemsnit og standardafvigelse for logwbc. Beregn selv et 95%-konfidensinterval for middelværdien. 4. Hvordan er fordelingen af køn? (Lav en tabel med table). 5. Hvordan er fordelingen af køn på de to behandlinger? Er der forskel på antallet af kvinder i de to grupper? (Lav et χ 2 -test). 6. Sammenlign logwbc for placebogruppen med logwbc for behandlingsgruppen - er der forskel? Er det vigtigt? 29 / 31
30 Overlevelsesanalyse i R: Remissionsdata: 1. Genskab KM-kurven for hver behandlingsgruppe for sig. Tilføj et 95%-konfidensinterval baseret på log(-log)-transformationen. 2. Genskab plottet indeholdende begge KM-kurver. 3. Udfør LogRank-testet. 4. Sammenlign mænd og kvinder mht. overlevelse. 5. Lav en ny variabel, som inddeler logwbc i høj / lav. Er der forskel på overlevelsen i disse to grupper? Lav en tilsvarende undersøgelse, hvor logwbc er inddelt i tre grupper lav / mellem / høj. Hvad ser vi? 30 / 31
31 Maligne melanomer: 1. Et datasæt om maligne melanomer er tilgængeligt i pakken timereg. Installér og aktivér pakken. Datasættet melanoma gøres tilgængeligt med kommandoen data(melanoma). 2. Dan et overblik over data med tabeller og histogrammer. Prøv at finde info på nettet om dette datasæt - hvordan skal status-variablen forstås? 3. Vi vil fokusere på død pga melanomer, dvs. død af andre årsager skal betragtes som censurering. Er der forskel på risikoen for død af maligne melanomer for mænd og kvinder? Hvori består forskellen? 4. Undersøg om andre variable kan have en betydning. 31 / 31
Introduktion til overlevelsesanalyse
Faculty of Health Sciences Introduktion til overlevelsesanalyse Kaplan-Meier estimatoren Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk
Læs mereIntroduktion til overlevelsesanalyse
Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:
Læs mereIntroduktion til SPSS
Introduktion til SPSS Øvelserne på dette statistikkursus skal gennemføres ved hjælp af det såkaldte SPSS program. Det er erfaringsmæssigt sådan, at man i forbindelse af øvelserne på statistikkurser bruger
Læs mereLineær og logistisk regression
Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression
Læs mereOverlevelsesanalyse. Faculty of Health Sciences
Faculty of Health Sciences Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Program Overlevelsesdata Kaplan-Meier estimatoren
Læs mereKommentarer til øvelser i basalkursus, 2. uge
Kommentarer til øvelser i basalkursus, 2. uge Opgave 2. Vi betragter målinger af hjertevægt (i g) og total kropsvægt (målt i kg) for 10 normale mænd og 11 mænd med hjertesvigt. Målingerne er taget ved
Læs mereInstitut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver
Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2 Københavns Universitet Susanne Ditlevsen og Helle Sørensen R opgaver Det er en god ide at vænne sig til at skrive kommandoerne i en editor
Læs mereR syntaks. Installation af R
R syntaks Denne note er en introduktion 1 til syntaksen i R. Den kode, vi skal bruge til modellerne, står i bogen eller kommer til at være på hjemmesiden i den takt, vi gennemgår teorien. Så det, vi skal
Læs mereIntroduktion til overlevelsesanalyse
Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression III Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:
Læs mereIntroduktion til R. March 8, Regne- og tegneprogrammet R kan frit downloades fra adressen. http : //mirrors.sunsite.dk.cran
Introduktion til R March 8, 2004 1 Adgang til R Regne- og tegneprogrammet R kan frit downloades fra adressen http : //mirrors.sunsite.dk.cran 2 Start og afslutning. Help. I et vindue starter i R, typisk
Læs mere1 Start og afslutning. Help.
Afdeling for Teoretisk Statistik STATISTIK 2 Institut for Matematiske Fag Jørgen Granfeldt Aarhus Universitet 24. september 2003 Hermed en udvidet udgave af Jens Ledet Jensens introduktion til R. 1 Start
Læs mereVi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.
Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i
Læs mereHOFTEALLOPLASTIK - DATAUDTRÆK OG IMPORT TIL EXCEL
HOFTEALLOPLASTIK - DATAUDTRÆK OG IMPORT TIL EXCEL Når man er logget på KMS systemet, vælges Dataudtræk under punktet Vælg modul, hvorefter der klikkes på Gå til: På næste side klikkes på knappen Opret:
Læs mereFaculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable
Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng
Læs mereOverlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.
1 Levetidsanalyse Overlevelsesfunktionen Censurering Kaplan-Meier estimatoren Hazard funktionen Proportionale hazards Multipel regression PSE (I17) FSV1 Statistik - 5. lektion 1 / 19 Overlevelsesfunktionen
Læs mereR / RStudio. Intro til R / RStudio
R / RStudio Intro til R / RStudio R R er et open source statstikprogram og programmeringssprog introduceret i 1993. Seneste version er 2.15.3 R kan downloades på www.r-project.org R er i udgangspunktet
Læs mereIntroduktion til overlevelsesanalyse
Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression II Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:
Læs mereIndledning. På de følgende sider vises, primært i tegneserieform, lidt om mulighederne i PC-AXIS for Windows.
Indledning PC-AXIS for Windows er et talbehandlingsprogram, der kan håndtere store mængder statistisk materiale. PC-AXIS giver mulighed for at arbejde videre med det statistiske materiale i egne programmer
Læs mereØvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test
Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Formålet med øvelsen er at analysere risikoen for død forbundet med forskelligt alkoholforbrug. I denne øvelse skal analyserne foretages
Læs mereDag 6: Interaktion. Overlevelsesanalyse
Dag 6: Interaktion. Overlevelsesanalyse How does CHD depend on gender and hypertension? Males: hypertension chd01 Females: Frequency Row Pct 0 1 Total ---------+--------+--------+ 0 352 95 447 78.75 21.25
Læs mereStatistik i GeoGebra
Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik
Læs mereKort intro til SAS. Efterår 2015. Janne Petersen Judith L Jacobsen Lene Theil Skovgaard
Kort intro til SAS Efterår 2015 Janne Petersen Judith L Jacobsen Lene Theil Skovgaard 1 Hvorfor SAS Kan alt Alle ph.d. studerende har gratis adgang Fra universitetet eller hospitalerne Kode --- hjælp fra
Læs mereStatistik FSV 4. semester 2014 Holdundervisning Uge 1: 4. februar Introduktion til Stata
Århus 27. januar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Holdundervisning Uge 1: 4. februar Introduktion til Stata Hvad er Stata? Stata er et program, der kan lave statistiske analyser af
Læs mereØvelser til basalkursus, 2. uge
Øvelser til basalkursus, 2. uge Opgave 1 Vi betragter igen Sundby95-materialet, og skal nu forbedre nogle af de ting, vi gjorde sidste gang. 1. Gå ind i ANALYST vha. Solutions/Analysis/Analyst. 2. Filen
Læs mereProgram dag 2 (11. april 2011)
Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge;
Læs mereRESPONSE INSIGHT HURTIG BRUGERMANUAL 2018 ASPEKT R&D A/S VERSION JANUAR 2018
VERSION 1.1 3. JANUAR 2018 RESPONSE INSIGHT HURTIG BRUGERMANUAL ASPEKT R&D A/S Torvebyen 2, 1, 4600 Køge, 5664 3838, aspekt@aspekt.dk 2018 ASPEKT R&D A/S Introduktion Med ResponseINSIGHT kan du skabe ny
Læs mereKlargøring af data til aflevering til DDA. Instruks
v Klargøring af data til aflevering til DDA Instruks Denne instruks gennemgår datadokumentationsformater m.v. for datasystemfiler, som skal afleveres til Dansk Data Arkiv efter indgået aftale om ekstern
Læs mereI dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)
I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest
Læs mereStatistik kommandoer i Stata opdateret 16/3 2009 Erik Parner
Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Indledning... 1 Hukommelse... 1 Simple beskrivelser... 1 Data manipulation... 2 Estimation af proportioner... 2 Estimation af rater... 2 Estimation
Læs mereStatistik kommandoer i Stata opdateret 22/ Erik Parner
Statistik kommandoer i Stata opdateret 22/4 2008 Erik Parner Indledning... 1 Simple beskrivelser... 1 Data manipulation... 1 Estimation af proportioner... 2 Estimation af rater... 2 Estimation af Relativ
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereMPH specialmodul Epidemiologi og Biostatistik
MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:
Læs mereStastistik og Databehandling på en TI-83
Stastistik og Databehandling på en TI-83 Af Jonas L. Jensen (jonas@imf.au.dk). 1 Fordelingsfunktioner Husk på, at en fordelingsfunktion for en stokastisk variabel X er funktionen F X (t) = P (X t) og at
Læs mereStatistiske Modeller 1: Kontingenstabeller i SAS
Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.
Læs mereKom godt i gang med I-bogen
Kom godt i gang med I-bogen At åbne bogen Det allerførste, du skal gøre, for at kunne arbejde med i-bogen, er at aktivere den. Det gøres ved at oprette en konto på systime.dk og derefter aktivere bogen
Læs mereFaculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018
Faculty of Health Sciences Basal Statistik Overlevelsesanalyse Lene Theil Skovgaard 12. marts 2018 1 / 12 APPENDIX vedr. SPSS svarende til diverse slides: Kaplan-Meier kurver, s. 3 Kumulerede incidenser
Læs mereHvorfor SAS Kort intro til SAS
Hvorfor SAS Kort intro til SAS Efterår 2015 Janne Petersen Judith L Jacobsen Lene Theil Skovgaard Kan alt Alle ph.d. studerende har gratis adgang Fra universitetet eller hospitalerne Kode --- hjælp fra
Læs mereBasal Statistik - SPSS
Faculty of Health Sciences Basal Statistik - SPSS Begreber. Parrede sammenligninger. Lene Theil Skovgaard 5. september 2017 1 / 16 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides
Læs mereFor at få 8 linjer ud, skal dette specifiseres i kommandoen ved at sætte antal lig 8 n=8:
Klasseøvelser dag 1 Opgave 1 1.1. Vi gemmer først dbase filen "perulung.dbf" i den relevante mappe og derefter sættes working directory til denne mappe ved at vælge menuen Session -> Set Working Directory
Læs mereSAS formater i Danmarks Statistik
Danmarks Statistik, Forskningsservice og Kundecenter 9. januar 2012 SAS formater i Danmarks Statistik 1. Indledning... 1 2. Hvor findes formater og øvrige datafiler?... 2 3. Hvordan bruges formater i SAS-programmet?...
Læs mereStatistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar
Århus 6. februar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Til disse øvelser har I brug for fishoil1.dta, der indeholder data fra det fiskeolie forsøg vi så på ved
Læs mereIntroduktion til MatLab Matematisk Modellering af Dynamiske Modeller ved Kasper Bjering Jensen, RUC, februar 2010
Introduktion til MatLab Matematisk Modellering af Dynamiske Modeller ved Kasper Bjering Jensen, RUC, februar 2010 Computere er uvurderlige redskaber for personer der ønsker at arbejde med matematiske modeller
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereHjemmeopgave, efterår 2009
Hjemmeopgave, efterår 2009 Basal statistik for sundhedsvidenskabelige forskere Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-29. oktober) I alt 112 piger har fået målt bone mineral
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mereBasal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 (
Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 (28.-30. oktober) En stor undersøgelse søger at afdække forhold
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereBasal Statistik - SPSS
Faculty of Health Sciences Basal Statistik - SPSS Regressionsanalyse. Lene Theil Skovgaard 5. februar 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Indlæsning og
Læs mereFagets IT Introduktion til MATLAB
Fagets IT Introduktion til MATLAB Mads G. Christensen mgc@kom.auc.dk Afdeling for Kommunikationsteknologi, Aalborg Universitet. MATLAB 2002 p.1/28 Kursusoversigt 1. Introduktion, matrix-indeksering, -operationer
Læs mereGIS. Guide til indlæsning af data i ArcGIS herunder KMS-data fra internettet
GIS Af Anders Bartholdy Guide til indlæsning af data i ArcGIS herunder KMS-data fra internettet Baggrundskort fra KMS er en rigtig god resurse der er tilgængelig via ArcGIS. Derfor starter vi med at gennemgå
Læs mereNaturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1
Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen
Læs mereOpgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved
Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,
Læs mereLøsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Læs mereVejledning til prototypen af RaConverter
Vejledning til prototypen af RaConverter Vejledning til prototypen af udtræksprogrammet RaConverter, der anvendes til at lave data- og metadataudtræk fra statistikprogrammer, der overholder Rigsarkivets
Læs mereFaculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016
Faculty of Health Sciences Basal Statistik Begreber. Parrede sammenligninger. Lene Theil Skovgaard 6. september 2016 1 / 88 APPENDIX Programbidder svarende til diverse slides: Indlæsning af vitamin D datasæt,
Læs mereSÅDAN BRUGER DU REGNEARK INTRODUKTION
SÅDAN BRUGER DU REGNEARK INTRODUKTION I vejledningen bruger vi det gratis program Calc fra OpenOffice som eksempel til at vise, hvordan man bruger nogle helt grundlæggende funktioner i regneark. De øvrige
Læs mereMorten Frydenberg 14. marts 2006
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen
Læs mereSPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse
Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 med instruktioner til SPSS-analyse svarende til
Læs mereFaculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.
Faculty of Health Sciences SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 22. januar 2018 1 / 20 SPSS APPENDIX med instruktioner til SPSS-analyse svarende
Læs mereSPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse
Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 11. februar 2019 med instruktioner til SPSS-analyse svarende til nogle
Læs mereIntroduktion Indtastning Funktioner Scripts Optimering. Matlab
- robert@math.aau.dk http://www.math.aau.dk/ robert/teaching/2010/matlab 9. august 2010 1/39 Disposition 1. Lidt om. 2. Basiskursus. 3. Opgaver. 4. Mere til basiskursus. 5. Opgaver. 2/39 MATLAB = MATrix
Læs mereMorten Frydenberg 26. april 2004
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.
Læs mereUndervisning i Dansk Palliativ Database
Undervisning i Dansk Palliativ Database - AnalysePortalen og mulighederne for at anvende egne data Undervisning i Dansk Palliativ Database - AnalysePortalen og mulighederne for at anvende egne data Dagens
Læs mereMaple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje.
Maple Dette kapitel giver en kort introduktion til hvordan Maple 12 kan benyttes til at løse mange af de opgaver, som man bliver mødt med i matematiktimerne på HHX. Skærmbilledet Vi starter med at se lidt
Læs mereKlasseøvelser dag 2 Opgave 1
Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereFable Kom godt i gang
Fable Kom godt i gang Opdateret: 26-03-2018 Indholdsfortegnelse 1. Først skal du installere programmet på din computer 3 2. Når programmet er installeret er du klar til at pakke robotten ud 4 3. Nu er
Læs mereBilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen
Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk
Læs mere02101 Indledende Programmering Introduktion til Eclipse
02101 Indledende Programmering Introduktion til Eclipse Version 2018 1 Introduktion I dette kursus lægger vi op til at man bruger det integrerede udviklingsmiljø Eclipse. Basalt set er et integreret udviklingsmiljø
Læs mereManual opdateret Oktober 2015 Copyright ABC Softwork Aps. Materialet må ikke gengives eller kopieres uden tilladelse. Download din gratis 30 dages
Manual opdateret Oktober 2015 Copyright ABC Softwork Aps. Materialet må ikke gengives eller kopieres uden tilladelse. Download din gratis 30 dages prøve på: http://abcsoftwork.com/free_trial 1 Velkommen
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereBasal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (
Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (10.-12. april) I et randomiseret forsøg sammenlignes vitamin D behandling
Læs mereR E D C A P M A N U A L. Importér data til REDCap fra CSV-fil. Opbyg din eksisterende database i REDCap Version 1.0
R E D C A P M A N U A L Importér data til REDCap fra CSV-fil Opbyg din eksisterende database i REDCap Version 1.0 Introduktion Der opstår ofte et ønske om at importere data fra andre databaser til REDCap,
Læs mereBasal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.
Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.-27 marts) Garvey et al. interesserer sig for sammenhængen mellem
Læs mereMSI pakke til distribution af AutoPilot komponenter.
MSI pakke til distribution af AutoPilot komponenter. Hermed følger en basal dokumentation for installation af AutoPilot msi pakken. Der vil i det følgende blive forklaret brugen af 4 programmer fra Microsoft,
Læs mereStatistik for Biokemikere Projekt
Statistik for Biokemikere Projekt Institut for Matematiske Fag Inge Henningsen og Helle Sørensen Københavns Universitet November 2008 Formalia Dette projekt udgør en del af evalueringen i kurset Statistik
Læs mereKom godt i gang med Fable-robotten
Kom godt i gang med Fable-robotten 1. Først skal du installere programmet på din computer. Gå ind på shaperobotics.com og under support vælger du download: Her vælger du, under PC App om du kører Windows
Læs mereIndstillinger. 1. Built-in viewer 2. Built-in viewer embedded 3. Ekstern viewer
TeXMaker guide TeXMaker er den editor, som vi anbefaler til at skrive LaTeX i. Det er en såkaldt cross-platform editor og kan benyttes til både Windows, Mac og Linux. TeXMaker er en ret almindelig editor
Læs mereOpgavebesvarelse, Basalkursus, uge 3
Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt
Læs mereMPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom.
MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom. For at I skal kunne regne på tallene fra undersøgelsen har vi taget en delmængde af variablene
Læs mereVejledning til opbygning af hjemmesider
Side 1 af 9 Vejledning til opbygning af hjemmesider Hvis du er inde på din klubs hjemmeside, fx på forsiden, kan du nu gå i gang med at redigere. For at få redigeringsværktøjet frem, skal du klikke på
Læs mereØkonometri 1 Forår 2006 Ugeseddel 11
Økonometri 1 Forår 2006 Ugeseddel 11 Program for øvelserne: Gruppearbejde og plenumdiskussion Introduktion til SAS øvelser SAS øvelser Øvelsesopgave 5: Paneldata estimation af indkomstligninger på danske
Læs mereIntroduktion til PCIM version 9.07
Danmarks Statistik MODELGRUPPEN Arbejdspapir Lars Brømsøe Termansen 25. marts 2003 (UDKAST) Introduktion til PCIM version 9.07 Resumé: Papiret beskriver kort om den nye version af PCIM løsningsprogrammet.
Læs mereDet kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.
1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;
Læs mereAnalyse af binære responsvariable
Analyse af binære responsvariable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet 23. november 2012 Har mænd lettere ved at komme ind på Berkeley? UC Berkeley
Læs mereStatistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs mereVi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.
Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,
Læs mereMan indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:
1 IHD-Lexis 1.1 Spørgsmål 1 Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: data ihdfreq; input eksp alder pyrs cases; lpyrs=log(pyrs); cards; 0 2 346.87 2 0 1 979.34 12 0 0 699.14
Læs mereBetjenings vejledning
Betjenings vejledning Clinical GPS A Global database with Clinical Decision Support working like a GPS Replaces guideline documents and local rules in the hospital Tjek på medicin Version 1.1 KN 2017.06.21
Læs mereSimpel Lineær Regression
Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige
Læs mereProgram. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration
Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion
Læs mereUdleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november)
Hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin D status i Europa, har man
Læs mereLøsning til opgave i logistisk regression
Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator
Læs mereKORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER
ANALYSERAPPORT KORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER Denne rapport samt bilag indeholder den endelige database af spørgeskemaet Anvendelsen af digitale ressourcer
Læs mereMorten Frydenberg Biostatistik version dato:
Caerphilly studiet Design og Data Biostatistik uge 14 mandag Morten Frydenberg, Afdeling for Biostatistik Poisson regression En primær tidsakse og ikke stykkevise konstante rater Cox proportional hazard
Læs mereTræningsaktiviteter dag 3
Træningsaktiviteter dag 3 I træningsaktiviteterne skal I arbejde videre med Framingham data og risikoen for hjertesygdom. I skal dels lave MH-analyser som vi gjorde i timerne og dels lave en multipel logistisk
Læs mereModelkontrol i Faktor Modeller
Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk
Læs mereØvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse
Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse 1. Hvor stor en andel af deltagerne var mænd? Var der samme andel i de tre randomiseringsgrupper?.
Læs mere