INTRODUKTION TIL dele af SAS

Save this PDF as:
 WORD  PNG  TXT  JPG

Størrelse: px
Starte visningen fra side:

Download "INTRODUKTION TIL dele af SAS"

Transkript

1 INTRODUKTION TIL dele af SAS Der er flere forskellige angrebsvinkler ved statistiske analyser i SAS. Vi skal her kun beskæftige os med to af disse, nemlig Direkte programmering. Brug af SAS ANALYST Hvilken af metoderne, man vælger at benytte, afhænger af flere forskellige forhold, såsom: tidligere programmeringserfaring karakter og omfang af det statistiske behov personlighed. For en nybegynder vil det formentlig være lettest at starte med at anvende ANA- LYST. Det er en menu-overbygning på SAS (version 8.1 eller 8.2), der indeholder store dele (men ikke alle) af de basale SAS-procedurer. Den indeholder desuden visse ting, som ikke findes i den direkte programmering, f.eks. noget grafik. Brug af ANALYST kræver ingen udenadslære, da menuerne er rimeligt selvforklarende, og der opstår ikke syntaksfejl. ANALYST har desuden den facilitet, at den skriver programmer for en, medens man peger og klikker. Når ANALYST ikke længere slår til, har man således råskitsen til et program, der derefter kan udbygges. Dette er ofte en større fordel end man umiddelbart skulle tro, idet datahåndteringen i SAS ofte er det, der falder brugeren sværest. Benytter man SAS meget, og især hvis man ofte udfører den samme slags analyser, vil det i længden virke meget tungt at anvende ANALYST. Der skal peges og klikkes mange gange for at indlæse, beskære, sortere, tabellere og analysere data, og det er vanskeligt bagefter at dokumentere (og huske) hvad der er foretaget. SAS i relation til andre programpakker Ved planlægningen af dette og lignende kurser er vi i en svær situation m.h.t valg af programmel. Der findes på markedet mange forskellige programpakker, der kan meget nær det samme, og ved valget af SAS vil vi ikke signalere, at andre muligheder er inferiøre. På basalkurset har vi i mange år benyttet programmet R. Dette er på mange måder væsentligt bedre end SAS, men har sine begrænsninger (endnu). F.eks. er der endnu ingen menuoverbygning og virker derfor lidt utilgængelig for en del. På enkelte andre kurser har vi benyttet SPSS, men på de fleste har vi benyttet SAS i en eller anden form. 1

2 Om fordele og ulemper ved SAS kan vi sammenfatte: Fordele: 1. kan klare store datamængder 2. har meget alsidige muligheder for datahåndtering 3. kan udføre langt de fleste statistiske analyser 4. fungerer på mange platforme 5. er rimelig billig 6. udleveres gratis, når man er ph.d. studerende ved fakultetet 7. er i mange sammenhænge blevet standard, således at man kan tillade sig at referere til den i metodesammenhænge Ulemper: 1. er noget gammeldags i sin opbygning 2. kan virke lidt tung 3. indeholder ingen lommeregnerfunktion 4. har ikke nogen flot grafik Brug af ANALYST Efter at have startet SAS 8.1 eller 8.2, klikker man på Solutions Analysis Analyst. Herefter får man et vindue bestående af et tomt dataark samt begyndelsen til en liste over, hvad man har foretaget sig (et såkaldt project tree, projekttræ). Man kan få data ind på flere måder ved at indtaste direkte i dataarket ved at importere allerede eksisterende SAS-filer ved at importere ASCII-filer (flade tekstfiler, f.eks. intastet i notepad) ved at importere datafiler fra andre systemer Vi skal se på import af ASCII-filer, f.eks. T:/bp.txt (mere om denne senere). Man klikker på File Open og klikker derefter på den relevante fil og svarer på spørgsmålene i den Dialog Box, der kommer frem (hvorvidt en eller flere af de øverste linier indeholder variabelnavne - det gør den første her - og hvilket symbol, der er benyttet som separator - her er det et blanktegn). Når man har fået data ind i dataarket, kan man gå i gang med at tegne, definere nye variable, analysere mv. Den letteste måde at lære ANALYST at kende på, er helt klart at forsøge sig frem, helst med et datasæt, der er overskueligt eller et, man kender godt. Der findes på maskinerne en del faste datasæt, man kan lege med, og der vil desuden, efterhånden som kurset skrider frem, (på N-drevet) blive indlagt nogle mere relevante datasæt, som vi skal beskæftige os med i øvelserne. 2

3 Direkte programmering Når man bliver en smule fortrolig med SAS eller når man får brug for at gøre tingene lidt hurtigere, f.eks. flere lignende analyser i træk, vil det være en fordel at gå over til direkte indtastning af programmer. Dette gøres i Editor-vinduet, og når man er færdig, køres programmet ved at bruge Submit under Run. Det er en god ide at gemme programmet under et letgennemskueligt navn, f.eks. projekt.sas, så det senere kan hentes ind igen og evt. modificeres. Bemærk dog, at så længe man er i gang med at rette et program til, bliver det stående i Editor-vinduet. Skulle det alligevel blive væk, tastes F4. Og hvordan skriver man så et SAS-program? Først skal man have data ind i systemet. Som regel vil man foretrække at lave en fil indeholdende alle data. Det kan gøres i Program Editor eller i et hvilketsomhelst andet system, der kan lave en ASCII-fil (en såkaldt flad fil, eller tekstfil). Typisk skal en sådan data-fil indeholde en linie for hvert individ (person, unit), og i denne linie står så alle oplysninger om dette individ, adskilt af blanktegn. Linierne kunne f.eks. se således ud: sexnr obese bp Der ville da være oplysning om 4 individer, og oplysningerne er (i rækkefølge fra venstre) køn (1:mænd, 2:kvinder), fedme (vægt divideret med idealvægt) samt blodtryk. Det er vigtigt at oplysningerne står i den samme rækkefølge for alle individer. Vi forestiller os nu, at disse 4 linier (samt header ) er gemt i datafilen bp.txt (dat for data). Man skriver nu sit SAS-program til indlæsning: data bp; infile T:\bp.txt firstobs=2; input sexnr obese bp; Bemærk, at første linie navngiver et temporært (midlertidigt) datasæt, der kun eksisterer indenfor det program, der er tale om. Hvis man vil have et permanent datasæt lagret, skal der i stedet stå data sasuser.bp; Anden linie fortæller, hvorfra data skal læses. Her angives, at man skal begynde læsningen ved observation nr. 2 (idet første linie jo indeholder variabelnavnene). Tredie linie fortæller, hvilke oplysninger, der ligger i hver linie. Her dannes altså 3 variable, sexnr, obese og bp, som har følgende betydning: sexnr Numerisk variabel, der angiver personenes køn, 1: mænd, 2: kvinder, 3

4 obese Personens fedmegrad, defineret som vægt divideret med idealvægt for given køn, alder og højde. bp Systolisk blodtryk Øvelse: Filen T:\bp.sas indeholder et SAS-program til indlæsning af disse tal på et permanent SAS-datasæt, sasuser.bp. Dog skal anden linie muligvis modificeres, så der står infile T:\bp.txt ; 1. Klik på programvinduet og hent SAS-programmet ind i dette vindue. 2. Kør programmet (evt. efter passende modifikationer) ved hjælp af Submit under Run. 3. Gå nu ind i ANALYST og find det permanente datasæt frem (klik File Open By SAS Name). Bemærk, at dette indeholder en variabel sex, som er en karaktervariabel, der angiver personenes køn (F: kvinder, M: mænd). Hvordan er denne fremkommet? 4. Benyt ANALYST til grafisk at illustrere fordelingen af blodtrykket for mænd resp. kvinder. Prøv jer frem! 5. Se den af SAS genererede kode ved at dobbeltklikke på Code -node n i projekttræet. Vælg Edit ProgramEditor for at få koden over i Editor-vinduet til videre redigering. Studer denne kode. Struktur Et SAS-program består groft sagt af to dele 1. Datahåndtering (data-steppet). Her indlæser man sine tal, definerer nye variable, f.eks. ved logaritmetransformation eller sammenlægning. Data-steppet afsluttes med 2. Procedurekald, herunder grafik. Når data foreligger på den rigtige facon, kan analyserne udføres ved hjælp af PROC et-eller-andet Hvert procedurekald afsluttes af 4

5 Datahåndtering SAS er meget alsidigt med hensyn til datahåndtering, og det vil føre alt for vidt på dette kursus at lære mere end det mest nødvendige. Nedenfor er vist nogle eksempler på definition af nye variable, som forhåbentligvis er selvforklarende. Bemærk, at den naturlige logaritme betegnes med log i SAS, medens 10-tals logaritmen benævnes log10. data a1; set sasuser.bp; if sexnr=1 then sex= male ; if sexnr=2 then sex= fem ; logbp=log(bp); Ved brug af ANALYST, skal man i stedet for ovenstående orderer benytte Data Transform Recode Ranges eller Data Transform Compute Log(Y) Procedurekald Når vi taler om de indbyggede SAS procedurer, er det bekvemt at skelne mellem 3 forskellige slags, nemlig 1. De helt basale, såsom udskrivning, sortering og udregning af basale størrelser som gennemsnit og spredning mv. 2. De egentlige statistiske analyser 3. Grafikken Der vil nedenfor blive givet en ganske kort introduktion til visse af disse procedurer. De basale procedurer 1. Udskrivning, PRINT (Reports List Data). proc print data=sasuser.bp; var sex bp; I linierne ovenfor behøver man kun at skrive det med fedt angivne, altså simpelthen proc print;. Det nyligst dannede datasæt vil da blive udskrevet i sin helhed. I stedet kan man som ovenfor angive hvilket datasæt, man vil have udskrevet og hvilke af de variable, man vil have med (og i hvilken rækkefølge). Tilføjelsen i sidste linie er strengt taget heller ikke nødvendig, hvis der følger andre procedurekald efter dette, men kan stærkt anbefales efter hvert 5

6 procedurekald, da den såkaldte log-fil (indeholdende oplysninger om hvordan kørslen er forløbet, fejlmeddelelser mv.) herved bliver væsentlig lettere at læse. 2. Sortering, SORT. data a1; set sasuser.bp; proc sort data=a1; by obese; 3. Tabellering, FREQ. Benyttes til at tabellere diskrete variable (i SAS kaldet CLASS-variable), som f.eks. sex. proc freq data=a1; tables sex; I ANALYST klikkes Statistics Descriptive Frequency Counts Udregning af basale stikprøvestørrelser, MEANS. For at se hvad denne procedure foretager sig, er det lettest at forsøge sig frem. Prøv f.eks. at skrive: proc sort; by sex; proc means; by sex; eller proc means; class sex; Bemærk, at man ved at skrive som ovenfor by sex; får udført den angivne procedure for hvert køn for sig (konstruktionen virker for stort set alle SASprocedurer), men man er nødt til at sortere observationerne først, hvis de ikke allerede står i den rigtige rækkefølge). I ANALYST klikkes Statistics Descriptive Summary Statistics Udregning af korrelationer, CORR: proc corr; var obese bp; Hvis man ikke medtager var-sætningen, får man korrelationer mellem alle variable i datasættet (hvilket ofte er ret irrelevant). I ANALYST klikkes Statistics Descriptive Correlations... 6

7 6. Uddybende oplysninger om en variabels fordeling, UNIVARIATE: proc univariate plot normal; by sex; var obese; Dette vil give os uddybende viden om fordelingen af FEDME i vores stikprøve, opdelt efter køn. De to options plot og normal bevirker hhv. et Box-plot samt et test for normalitet. I ANALYST klikkes Statistics Descriptive Distributions... De egentlige statistiske procedurer Vi skal naturligvis i dette kursus kun se på en ganske lille del af de eksisterende procedurer, f.eks. (nogle af) de, der omhandler varians- og regressionsanalyse. Her skal vi kun lige kort berøre to af dem, nemlig REG og GLM. 1. REG er designet til at udføre (multipel) regressionsanalyse i tilfældet, hvor alle kovariater er kontinuerte (dvs. ikke CLASS-variable). Notationen er: data a1; set sasuser.bp; logobese=log(obese); proc reg; model bp=obese logobese; I ANALYST klikkes Statistics Regression Linear... Hertil kommer en masse options, der kan benyttes til yderligere udskrivninger, modelkontrol og modifikationer af analysen. Nyttige udvidelser kunne være: proc reg; model bp=obese logobese / selection=backward corrb r influence; plot residual.*predicted.; Vi har her tilføjet nogle options efter model... / - og betydningen af disse er: selection=backward: Der foretages automatisk udsmidning af en kovariat ad gangen efter nærmere fastsatte kriterier (som man også selv kan styre). corrb: Herved får man udskrevet korrelationen mellem parameterestimaterne. r: Herved bliver predikterede (fittede) værdier, residualer, normerede residualer mv. udskrevet. 7

8 influence: Herved udskrives oplysninger vedrørende de enkelte observationers indflydelse på estimationen. At studere disse kendes under navnet Diagnostics. Herudover er der tilføjet en plot-sætning, der angiver, at vi gerne vil tegne residualplot for check af konstant varians. Ved hjælp af sådanne plot-sætninger kan man også konstruere f.eks. prediktionsgrænser i en simpel lineær regressionsmodel (med kun 1 kovariat). Disse grænser er givet ved variabelnavnene l95. hhv u95. (bemærk, at punktummet hører med til variabelnavnet). Vi kunne altså skrive proc reg; model bp=obese; plot (predicted. l95. u95.)*obese / overlay; Grafikken ved disse plot-sætninger er dog ikke overvældende god, og jeg foretrækker at skrive de relevante størrelser ud i et datasæt og derefter regne videre på dem, inclusive at lave grafik. Dette kan gøres ved proc reg; model bp=obese; output out=ud predicted=yhat residual=resid l95=lower u95=upper; Herved har vi dannet et nyt (temporært) datasæt, kaldet ud (egentlig work.ud), der indeholder alle de variable, der var i det oprindelige datasæt samt 4 nye, nemlig yhat, resid, lower og upper. Bemærk, at man i output-sætningen angiver, hvilke variable, der skal medtages, ved at specificere et keyword, efterfulgt af = og et navn, man selv bestemmer (men som gerne må være det samme som keyword et). 2. GLM er ligesom REG designet til at udføre multipel regression, men kan desuden håndtere diskrete variable, altså variable af typen CLASS. Dette er selvfølgelig ekstremt nyttigt i situationer, hvor der foreligger en eller flere grupperinger af individerne i materialet, f.eks. køn, social klasse, rygestatus mv. Så længe der kun er tale om variable på 2 niveauer, kan man stadig benytte REG (hvis man f.eks. inkluderer køn som kontinuert variabel i REG, vil den tilhørende regressionskoefficient blot være estimatet for forskellen mellem de to køn (overvej hvorfor!). Variable med mere end 2 niveauer kan også godt håndteres i REG, men så er man nødsaget til selv at definere såkaldte dummy variable, hvilket kan være en ganske vanskelig (og vovelig) affære, og man står sig ved i stedet at gå over til at benytte GLM. Her kan man f.eks skrive: proc glm; class sex; model bp=sex obese sex*obese / solution; 8

9 hvorved man vil få estimeret to linier for bp som funktion af obese, nemlig en for hvert køn (man har dog her antaget at variationen omkring linien er den samme for de to køn, så der er ikke tale om to helt separate analyser). I ANALYST klikkes Statistics ANOVA Linear Models... I modelformlen ovenfor indgår 3 led, hvis fortolkning er som følger: sex: Der er forskel på niveauet af blodtrykket for de to køn. obese: Blodtrykket afhænger lineært af fedmegraden. Hvis der ikke var medtaget flere end de første to led i modelformlen, ville modellen svare til to parallelle regressionslinier. sex*obese: Dette led udtrykker en såkaldt vekselvirkning (interaktion) mellem køn og fedmegrad. Den indebærer, at blodtrykkets afhængighed af fedmegraden (hældningen af linien) er forskellig for de to køn, eller sagt med andre ord: Forskellen på kønnene afhænger af, hvilken fedmegrad, man betragter. Option solution, som er anført i modelsætningen angiver, at vi gerne vil have skrevet estimaterne ud. Hvis denne ikke medtages, får man kun et variansanalyseskema med diverse tests. Grafik. Der kan skrives (er faktisk blevet skrevet) tykke bøger om at lave grafik ved hjælp af SAS. Den umiddelbart letteste tilgang hertil er at anvende ANALYST, men netop indenfor grafikken er ANALYST ikke særlig fleksibel, og man nødsages altså hurtigt til selv at foretage noget programmering. Selv for erfarne SAS-programmører kan det imidlertid være vanskeligt at huske alle finesser og options, og min personlige løsning på dette er at have en tegne-skabelon (en lille programstump), som jeg kopierer ind i nye programmer og retter til efter aktuelle data. En sådan programstump følger her proc gplot data=ud; plot bp*obese yhat*obese / overlay haxis=axis1 vaxis=axis2 frame; axis1 order=(0.9 to 1.5 by 0.1) length=12 cm value=(h=2) minor=none label=(h=3 obesity ); axis2 length=12 cm value=(h=2) minor=none label=(a=90 R=0 H=3 blood pressure ); 9

10 symbol1 v=circle i=none c=black l=1 w=2; symbol2 v=none i=join c=black l=1 w=2; title1 h=3 obesity and blood pressure ; I ANALYST klikkes Graphs Scatter Plot Two-Dimensional... Vi bemærker her følgende options: overlay: Dette bevirker, at de to specificerede plots bliver tegnet på samme tegning. I første plot benyttes symbolerne som angivet i symbol1 -sætningen, osv. haxis=axis1: specificerer den horisontale akse som axis1 order=(0.9 to 1.5 by 0.1)+: specificerer inddelingen af den horisontale akse length=12cm: specificerer længden af den pågældende akse value=(h=2): specificerer højden af de tal, der kommer til at stå på aksen minor=none: specificerer ingen små tickmarcks label=(h=3 obesity ): specificerer aksetekst, samt hvor stor denne skal være. For den vertikale akse angives desuden, at teksten skal roteres (A=90 R=0). 10

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes

Læs mere

Øvelser til basalkursus, 2. uge

Øvelser til basalkursus, 2. uge Øvelser til basalkursus, 2. uge Opgave 1 Vi betragter igen Sundby95-materialet, og skal nu forbedre nogle af de ting, vi gjorde sidste gang. 1. Gå ind i ANALYST vha. Solutions/Analysis/Analyst. 2. Filen

Læs mere

Kommentarer til øvelser i basalkursus, 2. uge

Kommentarer til øvelser i basalkursus, 2. uge Kommentarer til øvelser i basalkursus, 2. uge Opgave 2. Vi betragter målinger af hjertevægt (i g) og total kropsvægt (målt i kg) for 10 normale mænd og 11 mænd med hjertesvigt. Målingerne er taget ved

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Introduktion til SPSS

Introduktion til SPSS Introduktion til SPSS Øvelserne på dette statistikkursus skal gennemføres ved hjælp af det såkaldte SPSS program. Det er erfaringsmæssigt sådan, at man i forbindelse af øvelserne på statistikkurser bruger

Læs mere

SPSS introduktion Om at komme igang 1

SPSS introduktion Om at komme igang 1 SPSS introduktion Om at komme igang 1 af Henrik Lolle, oktober 2003 Indhold Indledning 1 Indgang til SPSS 2 Frekvenstabeller 3 Deskriptive statistikker gennemsnit, standardafvigelse, median osv. 4 Søjlediagrammer

Læs mere

Regressionsanalyse i SAS

Regressionsanalyse i SAS Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse

Læs mere

ØVELSE 2B. Formål Det primære formål med denne øvelse er at prøve nogle vigtige procedurer til statistisk og grafisk analyse.

ØVELSE 2B. Formål Det primære formål med denne øvelse er at prøve nogle vigtige procedurer til statistisk og grafisk analyse. ØVELSE 2B I denne øvelse gennemgår vi: Udskrivning ved hjælp af PUT. Procedurerne FREQ, UNIVARIATE og CORR. Overførsel af procedure-uddata til et datasæt. Fremstilling af histogrammer og XY-plots. Formål

Læs mere

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016 Faculty of Health Sciences Basal Statistik Begreber. Parrede sammenligninger. Lene Theil Skovgaard 6. september 2016 1 / 88 APPENDIX Programbidder svarende til diverse slides: Indlæsning af vitamin D datasæt,

Læs mere

Introduktion til SAS. Faculty of Health Sciences

Introduktion til SAS. Faculty of Health Sciences Faculty of Health Sciences Introduktion til SAS Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Eksempel: Blodtryk og fedme OBESE: vægt/idealvægt,

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes

Læs mere

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 med instruktioner til SPSS-analyse svarende til

Læs mere

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22. Faculty of Health Sciences SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 22. januar 2018 1 / 20 SPSS APPENDIX med instruktioner til SPSS-analyse svarende

Læs mere

Faculty of Health Sciences. Basal statistik. Lille SAS Manual. Lene Theil Skovgaard. 31. januar 2017

Faculty of Health Sciences. Basal statistik. Lille SAS Manual. Lene Theil Skovgaard. 31. januar 2017 Faculty of Health Sciences Basal statistik Lille SAS Manual Lene Theil Skovgaard 31. januar 2017 1 / 42 Selve sproget Siderne 9-18 Indlæsning (9-12) Definition af nye variable (13) Missing values / Manglende

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Basal Statistik - SPSS Den generelle lineære model. Lene Theil Skovgaard 24. oktober 2017 Biokemisk iltforbrug,

Læs mere

Basal statistik. Selve sproget. Grafik. Basale procedurer. Faculty of Health Sciences. Lille SAS Manual

Basal statistik. Selve sproget. Grafik. Basale procedurer. Faculty of Health Sciences. Lille SAS Manual Faculty of Health Sciences Selve sproget Basal statistik Lille SAS Manual Lene Theil Skovgaard 5. september 2017 Siderne 9-18 Indlæsning (9-12) Definition af nye variable (13) Missing values / Manglende

Læs mere

Kort intro til SAS. Efterår 2015. Janne Petersen Judith L Jacobsen Lene Theil Skovgaard

Kort intro til SAS. Efterår 2015. Janne Petersen Judith L Jacobsen Lene Theil Skovgaard Kort intro til SAS Efterår 2015 Janne Petersen Judith L Jacobsen Lene Theil Skovgaard 1 Hvorfor SAS Kan alt Alle ph.d. studerende har gratis adgang Fra universitetet eller hospitalerne Kode --- hjælp fra

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Kovariansanalyse. Lene Theil Skovgaard 3. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Bland-Altman plot,

Læs mere

Økonometri 1 Efterår 2006 Ugeseddel 11

Økonometri 1 Efterår 2006 Ugeseddel 11 Økonometri 1 Efterår 2006 Ugeseddel 11 Program for øvelserne: Gruppearbejde og plenumdiskussion Introduktion til SAS øvelser SAS øvelser Øvelsesopgave: Paneldata estimation Sammenhængen mellem alder og

Læs mere

SAS systemet SAS. SAS vinduer. 2012 Janne Petersen

SAS systemet SAS. SAS vinduer. 2012 Janne Petersen SAS systemet SAS 2012 Janne Petersen February 7, 2012 Styrken i SAS er dets evne til at håndtere store datasæt. Det er hurtigt og har mange statistiske og ikke-statistiske muligheder. Kan "alt", så det

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity hentet fra P. Armitage & G. Berry: Statistical methods in medical research. 2nd ed. Blackwell, 1987. Spørgsmål 1: Indlæs data og konstruer en faktor (klassevariabel)

Læs mere

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen Opgavebesvarelse, Resting metabolic rate I filen T:\Basalstatistik\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991

Læs mere

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Århus 6. februar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Til disse øvelser har I brug for fishoil1.dta, der indeholder data fra det fiskeolie forsøg vi så på ved

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

Hvorfor SAS Kort intro til SAS

Hvorfor SAS Kort intro til SAS Hvorfor SAS Kort intro til SAS Efterår 2015 Janne Petersen Judith L Jacobsen Lene Theil Skovgaard Kan alt Alle ph.d. studerende har gratis adgang Fra universitetet eller hospitalerne Kode --- hjælp fra

Læs mere

Lineær regression i SAS. Lineær regression i SAS p.1/20

Lineær regression i SAS. Lineær regression i SAS p.1/20 Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Multipel regression. Lene Theil Skovgaard 10. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Figurer: s.

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Begreber. Parrede sammenligninger. Lene Theil Skovgaard 5. september 2017 1 / 16 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng

Læs mere

SAS formater i Danmarks Statistik

SAS formater i Danmarks Statistik Danmarks Statistik, Forskningsservice og Kundecenter 9. januar 2012 SAS formater i Danmarks Statistik 1. Indledning... 1 2. Hvor findes formater og øvrige datafiler?... 2 3. Hvordan bruges formater i SAS-programmet?...

Læs mere

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende

Læs mere

Økonometri 1 Forår 2006 Ugeseddel 11

Økonometri 1 Forår 2006 Ugeseddel 11 Økonometri 1 Forår 2006 Ugeseddel 11 Program for øvelserne: Gruppearbejde og plenumdiskussion Introduktion til SAS øvelser SAS øvelser Øvelsesopgave 5: Paneldata estimation af indkomstligninger på danske

Læs mere

Statistik Lektion 17 Multipel Lineær Regression

Statistik Lektion 17 Multipel Lineær Regression Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Basal statistik. 21. oktober 2008

Basal statistik. 21. oktober 2008 Basal statistik 21. oktober 2008 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Parametriseringer Kovariansanalyse Esben Budtz-Jørgensen, Biostatistisk Afdeling

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Lineære sammenhænge, residualplot og regression

Lineære sammenhænge, residualplot og regression Lineære sammenhænge, residualplot og regression Opgave 1: Er der en bagvedliggende lineær sammenhæng? I mange sammenhænge indsamler man data som man ønsker at undersøge og afdække eventuelle sammenhænge

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: 1 IHD-Lexis 1.1 Spørgsmål 1 Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: data ihdfreq; input eksp alder pyrs cases; lpyrs=log(pyrs); cards; 0 2 346.87 2 0 1 979.34 12 0 0 699.14

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Statistik i GeoGebra

Statistik i GeoGebra Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

APPENDIX A INTRODUKTION TIL DERIVE

APPENDIX A INTRODUKTION TIL DERIVE APPENDIX A INTRODUKTION TIL DERIVE z x y z=exp( x^2 0.5y^2) CAS er en fællesbetegnelse for matematikprogrammer, som foruden numeriske beregninger også kan regne med symboler og formler. Det betyder: Computer

Læs mere

Adgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A)

Adgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A) Økonometri 1 Forår 2003 Ugeseddel 13 Program for øvelserne: Gruppearbejde Opsamling af gruppearbejdet og introduktion af SAS SAS-øvelser i computerkælderen Øvelsesopgave 6: Hvem består første årsprøve

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

To samhørende variable

To samhørende variable To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen

Læs mere

k normalfordelte observationsrækker (ensidet variansanalyse)

k normalfordelte observationsrækker (ensidet variansanalyse) k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er

Læs mere

Easy Guide i GallupPC

Easy Guide i GallupPC Easy Guide i GallupPC Version. 6.00.00 Gallup A/S Masnedøgade 22-26 DK 2100 København Ø Telefon 39 27 27 27 Fax 39 27 50 80 Indhold SÅDAN KOMMER DU I GANG MED AT ANVENDE GALLUPPC... 2 TILFØJELSE AF UNDERSØGELSER

Læs mere

Velkommen til StatBK. Program. Introduktion, summary measures, SAS. Praktisk info. Praktisk info

Velkommen til StatBK. Program. Introduktion, summary measures, SAS. Praktisk info. Praktisk info Program Introduktion, summary measures, SAS Helle Sørensen E-mail: helle@math.ku.dk I dag: Praktiske informationer Faglig intro: et par dataeksempler Datatyper Beskrivende statistik, bla. gennemsnit og

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Appelsiner, bananer og citroner

Appelsiner, bananer og citroner Appelsiner, bananer og citroner Af: Peter Kellberg Danmarks Statistik Sejrøgade DK-00 København Ø pke@dstdk SAS og øvrige SAS Institute Inc-produkter samt navngivne serviceydelser er registrerede varemærker

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

PROC TRANSPOSE. SAS-tabellen - hensigtsmæssig lagring af data. Copyright 2011 SAS Institute Inc. All rights reserved.

PROC TRANSPOSE. SAS-tabellen - hensigtsmæssig lagring af data. Copyright 2011 SAS Institute Inc. All rights reserved. PROC TRANSPOSE SAS-tabellen - hensigtsmæssig lagring af data Copyright 2011 SAS Institute Inc. All rights reserved. Transponerede tabeller Brede eller smalle? Hvad: Brede tabeller har mange kolonner med

Læs mere

MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom.

MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom. MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom. For at I skal kunne regne på tallene fra undersøgelsen har vi taget en delmængde af variablene

Læs mere

Basal statistik. 30. januar 2007

Basal statistik. 30. januar 2007 Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

HOFTEALLOPLASTIK - DATAUDTRÆK OG IMPORT TIL EXCEL

HOFTEALLOPLASTIK - DATAUDTRÆK OG IMPORT TIL EXCEL HOFTEALLOPLASTIK - DATAUDTRÆK OG IMPORT TIL EXCEL Når man er logget på KMS systemet, vælges Dataudtræk under punktet Vælg modul, hvorefter der klikkes på Gå til: På næste side klikkes på knappen Opret:

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Afdeling for Teoretisk Statistik August 2004 Institut for Matematisk fag Aarhus Universitet. Jørgen Granfeldt INTRODUKTION TIL SAS 1

Afdeling for Teoretisk Statistik August 2004 Institut for Matematisk fag Aarhus Universitet. Jørgen Granfeldt INTRODUKTION TIL SAS 1 Afdeling for Teoretisk Statistik August 2004 Institut for Matematisk fag Aarhus Universitet Jørgen Granfeldt INTRODUKTION TIL SAS 1 1 Eksempler baseret på SAS 9.1 for Windows Indholdsfortegnelse INDHOLDSFORTEGNELSE................................

Læs mere

SAS systemet. Kort introduktion til SAS. SAS vinduer. Janne Petersen. Efterår 2013

SAS systemet. Kort introduktion til SAS. SAS vinduer. Janne Petersen. Efterår 2013 SAS systemet Kort introduktion til SAS Janne Petersen Efterår 2013 Styrken i SAS er dets evne til at håndtere store datasæt. Det er hurtigt og har mange statistiske og ikke-statistiske muligheder. Kan

Læs mere

Træningsaktiviteter dag 3

Træningsaktiviteter dag 3 Træningsaktiviteter dag 3 I træningsaktiviteterne skal I arbejde videre med Framingham data og risikoen for hjertesygdom. I skal dels lave MH-analyser som vi gjorde i timerne og dels lave en multipel logistisk

Læs mere

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25. Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.-27 marts) Garvey et al. interesserer sig for sammenhængen mellem

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger. Opgavebesvarelse, Resting metabolic rate I filen rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al., Am.

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen Microsoft Excel har en del standard anvendelsesmuligheder i forhold til den beskrivende statistik og statistisk

Læs mere

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017 Faculty of Health Sciences Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 26. september 2017 1 / 85 Simpel lineær regression Regression og korrelation Simpel lineær regression Todimensionale

Læs mere

EVALUERING I SURVEYXACT TRIN FOR TRIN

EVALUERING I SURVEYXACT TRIN FOR TRIN EVALUERING I SURVEYXACT TRIN FOR TRIN LÆR AT TACKLE 2015 KOMITEEN FOR SUNDHEDSOPLYSNING 1 INDLEDNING Komiteen for Sundhedsoplysning stiller SurveyXact et internetbaseret redskab til kvalitetssikring til

Læs mere

Stastistik og Databehandling på en TI-83

Stastistik og Databehandling på en TI-83 Stastistik og Databehandling på en TI-83 Af Jonas L. Jensen (jonas@imf.au.dk). 1 Fordelingsfunktioner Husk på, at en fordelingsfunktion for en stokastisk variabel X er funktionen F X (t) = P (X t) og at

Læs mere

Introduktion til GLIMMIX

Introduktion til GLIMMIX Introduktion til GLIMMIX Af Jens Dick-Nielsen jens.dick-nielsen@haxholdt-company.com 21.08.2008 Proc GLIMMIX GLIMMIX kan bruges til modeller, hvor de enkelte observationer ikke nødvendigvis er uafhængige.

Læs mere

EVALUERING I SURVEYXACT TRIN FOR TRIN

EVALUERING I SURVEYXACT TRIN FOR TRIN EVALUERING I SURVEYXACT TRIN FOR TRIN LÆR AT TACKLE 2015 KOMITEEN FOR SUNDHEDSOPLYSNING 1 INDLEDNING Komiteen for Sundhedsoplysning stiller SurveyXact et internetbaseret redskab til kvalitetssikring til

Læs mere

Kom godt igang med Inventar registrering

Kom godt igang med Inventar registrering Kom godt igang med Inventar registrering (InventoryDB) (Med stregkodesupport) programmet fra PetriSoft Introduktion... 1 Inventar registrering... 2 Værktøjsudleje... 3 Service database til reperationer

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 21. februar 2017 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere