STATA A WORKFLOW APPROACH... Version 12 / 2012 Jakob Hjort, DataManager, MPH

Størrelse: px
Starte visningen fra side:

Download "STATA A WORKFLOW APPROACH... Version 12 / 2012 Jakob Hjort, DataManager, MPH"

Transkript

1 STATA A WORKFLOW APPROACH... Version 12 / 2012 Jakob Hjort, DataManager, MPH 1

2 3. Hent, sammenkør & gem 4. Inspicér, oprens & klargør 5. Dokumentation 6. Variabel behandling (numeriske-/talvariable) 7. Variabel behandling (streng-/tekstvariable) 8. Variabel behandling (dato variable) 9. Variabel behandling (time/klokkeslæt variable) 10. Missing values 11. Deskriptiv statistik 12. Analytisk statistik 13. Grafer I/II 14. Grafer II/II Appendiks: Generel kommando-opbygning Logiske udtryk Stata som regnemaskine (immediate kommandoer) Yderligere ressourcer 2

3 HENT, SAMMENKØR, GEM use (sti &) filnavn use data2004.dta, clear (use (sti &) filnavn A, clear) append using (sti &) filnavn B (use data2004.dta, clear) append using data2005.dta sort var(s) sort cpr gsort -cpr (use (sti &) filnavn A, clear) merge var(s) using (sti &) filnavn B 1:1 merge 1:m var(s) using (sti &) filnavn B m:1 V...10: cd sti cd c:\data Ver. 11..: (use data2004.dta, clear) merge cpr using extra_data.dta merge 1:1 cpr using extra_data.dta duplicates list var(s) duplicates list cpr V...10: Ver. 11..: save (sti &) filnavn, replace save data_samlet.dta, replace A B A B 1:1 match A B 1:mange match Angiv arbejdsbibliotek på disk. Arbejdsbiblioteket er der hvor Stata forventer at finde data, men også der hvor Stata som udgangspunkt vil placere output og filer. Hent et datasæt fra disk (harddisk, CD eller andet) ind i data editor. Takket være cd (ovenfor) angives kun selve filnavnet. Clear tillader at evt data i data editor ryddes (overskrives). Tilføj extra observationer/cases (datasæt B) til data editor (datasæt A). Bruges f.eks. til at kombinere data fra to årgange i eet datasæt. Operationen giver umiddelbart kun mening hvis de to datasæt (A & B) er helt (eller næsten) ens hvad angår variable. Vær navnlig opmærksom på eventuelle variable med samme navn men forskelligt indhold. Sortér data i stigende orden efter valgfri(e) variable. Første variabel er primære nøgle, en evt efterfølgende variabel bliver sekundær nøgle etc... gsort giver mulighed for at sortere i faldende orden (-) Tilføj extra variable (fra datasæt B) til data editor (datasæt A). Observationer fra datasæt B kobles med observationer fra datasæt A ved sammefald i nøgleværdi(er). Nøgle-variable SKAL have samme navn(e). I ver. 10 (ikke 11!) SKAL datasæt A & B være sorteret. Variablen: _merge genereres automatisk og vil for hver observation antage værdien: 1 (kun A), 2 (kun B) el. 3 (A & B). mange-til-mange match er noget rod som sikkert bør håndteres helt anderledes. Check for eventuelle dubletcases med kommandoen: duplicates list. Gem datasæt fra data editor på disk. Replace (til sidst) tillader at evt eksisterende fil overskrives. Det er kun sjældent nødvendigt/hensigtsmæssigt at gemme data; enten fordi data ikke er (bevist) ændret eller fordi evt. ændringer let kan genetableres via do-files. 3

4 INSPICÉR, OPRENS & KLARGØR summarize var(s) summarize dag maaned aar lookfor søgestreng lookfor medicin Et første orienterende overblik over data... Variabeloversigt med angivelse af antal (ikke-missing) observationer, gennemsnit, standard dev. samt minimum og makismum værdier. Variabeloversigt over alle variable hvor søgestreng indgår i enten variabelnavn eller variabellabel. codebook var(s) codebook dag maaned aar evt +:, compact Kodebog: udvidet variabeloversigt: variable, variabel- og valuelabels mm. Inklusiv noget basal statistik. Angivet uden variable-liste udløses oversigt over alle var. drop var(s) drop dag maaned aar X X Slet variable (fra data editor). Virkningen bliver permanent når/hvis data efterfølgende gemmes vær derfor kritisk: check dig selv. drop if logisk-udtryk drop if ryger==1 X X Slet observation/case (fra data editor) Virkningen bliver permanent når/hvis data efterfølgende gemmes vær derfor kritisk: check dig selv. order var(s) order cpr Arrangér udvalgte variable i en ønsket rækkefølge fra start (første kolonne) Har ingen betydning for selve informationen i data, men kan være med til at lette overblikket væsentligt. order var(s), after(start-var) order bmi, after(weight) Arrangér udvalgte variable i en ønsket rækkefølge lige efter en specificeret kolonne (variabel). En nyberegnet BMI (udfra højde og vægt) vil ligge i sidste kolonne. Hermed kan den flyttes hen til højde & vægt. collapse (aggregat funktion) var(s), by(gruppevar(s)) collapse (sum) ant_dage, by(cpr) A B A A B B B Saml (aggregér) observationer/cases i grupper med fælles karakteristika. Udover sum kan der angives: min, max, mean, count m.fl. 4

5 DOKUMENTATION label variable var label variable ryger Ryger patienten? Tilknyt labels til variable: Proceduren for variable labels er meget ligefrem (!). label define varlabel Val1 Val1Label Val2 Val2Label... label values var(s) varlabel label define yesno 1 Ja 2 Nej label values ryger yesno numlabel,add numlabel,remove evt. +:, modify Tilknyt labels til variable values: Labeling af values er lavet på den måde at man først definere et navngivet labelsæt, som derefter tilknyttes variable(n). Besværligt? Måske, men fordelen er at labelsæt kan genbruges og hæftes på flere variable. Vis både values og labels i tabeller mv. * kommentar alternativt: // kommentar Kommentarer i do-files. Hvad der i kampens hede virker logisk og ligefremt, kan ved gensyn efter et par måneder virke ret kryptisk, - rigelige kommentarer kan afhjælpe dette problem. capture log close log using navn_på_log_fil, text replace capture log close log using oprensning.log", text replace log close Tip: Ved at navngive loggen med endelsen: *.doc - vil den ved dobbeltklik, automatisk blive åbnet i Word. : Afslutter log-føringen Logning Enkel håndtering af logning, som logger med et indhold svarende til result-vinduet, Grafik må håndteres separat. Det er MEGET fornuftigt at give loggen samme navn som do-filen!! i eksemplet: oprensing Placer de to linier (capture log... hhv log using ) øverst og log close i slutningen af do-filen, og der vil altid foreligge en opdateret logfil. 5

6 VARIABEL BEHANDLING (NUMERISKE- / TALVARIABLE) generate Nyvar num =1 / replace Nyvar num =2 << Beregner/opretter/erstatter variabel. Findes variablen (Nyvar) i forvejen er man nødt til enten at benytte replace eller starte med: drop var. Nyvar num =var1+var2 : addition Nyvar num =var1- var2 : substraktion Nyvar num =var1*var2 : multiplikation Nyvar num =var1/var2 : division Nyvar num =mod(var1,var2) : divisions-rest Nyvar num =sqrt(var) : kvadratrod Nyvar num =var^n : opløftning i n de (eks: var^2 = var*var) Regne-arter taler vel for sig selv Kan sættes sammen i eet væk benyt rigeligt med parenteser, for at sikre at beregningsudtryk udregnes (evalueres) i korrekt rækkefølge (eks.: BMI=vægt/højde*højde vs BMI=vægt/(højde*højde). format var %5.2f Nyvar num =round(var) Nyvar num =int(var) : Heltals afrunding (.0-.4 rundes ned/.5-.9 rundes op) : Trunkering evt. decimaler ignoreres (skæres bort) Nyvar num =round(var,0.1) : Afrunding til et ønsket antal decimaler (i eks.: 1) : Formaterer (i eks.: 5 pladser hvoraf 2 er decimaler) recode var num (fra1/til1=1)(fra2/til2=2)(fra3/til3=3), generate(nyvar num ) recode alder (min/26=1)(26/65=2)(65/max=3), generate(aldergr) recode alder (min/26=1 unge )(26/65=2 ældre )(65/max=3 gamle ), generate(aldergr) Afrunding sommetider giver beregninger (f.eks. af BMI) resultater med flere decimaler end data egentlig kan bære, det eneste rimelige i disse situationer er at afrunde. Formatér er også en slags afrunding (Hvad man ikke ser har man ikke ondt af!) Omkoder (grupperer) kontinuerte variable til kategorier. Bemærk: recode kan hæfte labels på kategorier i eet hug., generate bevarer den originale variabel. recode udd5 (1 2=1 Læge/tandlæge )(3=2 sygepl. )(4 5=3 terapeuter ), generate(udd3) Nyvar num =real(var str ) : Let at bruge MEN egner sig kun til små tal ( CPR!) destring var str, generate(nyvar num ) encode var str, generate(nyvar num ) : Destring oversætter direkte og kræver derfor at indholdet af var svarer til (kan læses som) et tal. : Encode konverterer kategoriske strengværdier til numeriske koder (1,2 n), - oprindelige streng-værdier udgør nye labels! Samme kommando omkoder (omgrupperer) kategori variable til andre kategorier. Konverterer en streng- til en numerisk variable. Konverterer en streng- til en numerisk variable. Destring kan f.eks. bruges til at konvertere CPR-numre fra streng- til numeriskformat. PAS PÅ CPR-FÆLDEN!!!! Cpr-numre (kodet numerisk) kan i STATA, i lighed med dato/klokkeslæt variable (se side 9), kun rummes i formatet: double I andre formater sker der, UANMELDT, højst uhensigtsmæssige ændringer af variabel indhold dvs cpr bliver uigenkendeligt fadæsen er irreversibel 6

7 VARIABEL BEHANDLING (STRENG- / TEKSTVARIABLE) generate Nyvar str = Nyoprettet streng-variabel / replace Nyvar str = Ændret streng-variabel << Beregner/opretter/erstatter streng variable. Findes variablen (Nyvar) i forvejen er man nødt til enten at benytte replace eller starte med drop var. Nyvar str = var1 str + + var2 str : Sætter var1 og var2 sammen med et mellemrum Nyvar str = substr(var str,pos,lng) : Returnerer den del af var som starter ved POS og fortsætter LNG-tegn frem. Nyvar num = length(var str ) : Returnerer længden af det faktiske indhold af var Sætter strenge sammen (i forlængelse af hinanden) Isolér delstreng af streng Returnerer længden af streng-variabel. Nyttig både hvis man med substr skal isolere en venstre-del af en streng, og hvis man f.eks. ønsker at indsætte et foranstillet 0 i cpr-numre med længden 9. Nyvar str = upper(var str ) Nyvar str = lower(var str ) Nyvar str = proper(var str ) : Konverterer var til store bogstaver : Konverterer var til små bogstaver : smukkeserer var: Store begyndelses bogstaver og i øvrigt små bogstaver Formatér Nyvar = index(var str,tekst) : Returnerer position for Tekst i var hvis Tekst ikke findes i var returneres: 0. Index er følsom for store/små bogstaver (benyt upper eller lower) Find tekst i streng. Index returnerer position, hvilket man vel sjældent er interesseret i derimod kan det være meget anvendeligt at afgøre om f.eks. et bestemt præparat står anført i en streng indeholdende medicinforbrug. Nyvar str = string(var num ) : Konverterer den numeriske var ( råt ) til en streng Nyvar str = string(var num, %10.0f ) : Konverterer den numeriske var i formatet %10.0f (se variable behandling (numeriske-/ ) : format) Konverterer en numerisk variabel til en streng. String kan f.eks. bruges til at konvertere CPR-numre i numerisk format til strengformat (modsat real). 7

8 VARIABEL BEHANDLING (DATO VARIABLE) generate Nyvar dato =d( ) / replace Nyvar dato =d( ) << Beregner/opretter/erstatter dato-variabel Findes variablen (Nyvar) i forvejen er man nødt til enten at benytte replace eller starte med drop var. Nyvar dato =mdy(måned,dag,år) : år SKAL angives som 4 cifret årstal. Komponerer dato-variabel udfra: dag, måned og år. Datoen optræder i første omgang som antal dage fra 1. januar 1960, og skal formateres for at se ordentlig ud. Nyvar num =day(var dato ) Nyvar num =month(var dato ) Nyvar num =year(var dato ) : isolerer dag i måned (numerisk: 1-31) udfra en dato : isolerer måned (numerisk: 1-12) udfra en dato : isolerer (numerisk 4 cifret) år udfra en dato Opsplitter dato-variabel i hhv dag, måned og år Nyvar num =var1 dato -var2 dato : Returnerer antal dage mellem de to datoer Trækker to datoer fra hinanden Man kan selvfølgelig også lægge to datoer sammen, men det giver bare ingen mening, da hver dato blot er en afstand (antal dage) fra 1. januar Nyvar=var1 dato -var2 num Nyvar=var1 dato +var2 num : Returnerer ny dato (var1 dato et antal dage (var2)) : Returnerer ny dato (var1 dato + et antal dage (var2)) Trækker et antal dage fra en dato / lægger et antal dage til en dato format var dato %d format var dato %dd/n/y format var dato %dd-n-cy : Formaterer svarende til: 15jun1998 : Formaterer svarende til: 15/06/98 : Formaterer svarende til: Formaterer en dato variable. Det kan virke overraskende at måned, i eksemplerne, angives som: N! M resulterer i måneds navne (forkortet) og N resulterer i måneds nummer (1-12). format var dato %5.0f : Formaterer f.eks.: 15jun1998 til (14045 = antal dage mellem 1/ og 15/6 1998) Konverterer en dato- til en numerisk variabel. Datoer er i Stata grundlæggende numeriske variable med dato formatering, hvorfor tricket er at udskifte dato-formatering med en numerisk formatering. Det er ofte hensigtsmæssigt/nødvendigt at inspicere data i data editor / browser efter beregninger, omkodninger mv. -ved store datasæt vil man dog ofte have gavn af at skrive: browse var(s) (f.eks. browse cpr barndato alder), hvorved der åbnes en data browser med kun de angivne variable 8

9 VARIABEL BEHANDLING (TIME/KLOKKESLÆT VARIABLE) generate double Nyvar time =hms(12,24,00) / replace double Nyvar time =hms(12,25,00) Komponerer en time-variabel udfra: timer, minutter og sekunder samt evt.: dag, måned og år Hvis ikke der angives dato informationer, tildeler Stata automatisk datoen: 1. januar generate double Nyvar time =mdyhms(15,06,1998,12,24,00) / replace double Nyvar time =mdyhms(15,08,1998,12,25,00) Nyvar dato =dofc(var time ) OBS: Time-variable er et antal millisekunder, og kan derfor blive et MEGET stort tal man skal derfor AKTIVT angive double efter generate/replace Skræller klokkeslætsdelen af en time-variable = konverterer til en dato-variabel. Nyvar num =year(dofc(var time )) Nyvar num =month(dofc(var time )) Nyvar num =day(dofc(var time )) Nyvar num =hh(var time ) Nyvar num =mm(var time ) Nyvar num =ss(var time ) Opsplitter time-variabel i hhv.: år, måned, dag, timer, minutter og sekunder. Nyvar num =var1 time -var2 time : Antal millisekunder mellem de to klokkeslæt Nyvar num =int((var1 time -var2 time )/1000) - omregnet til hele sekunder Nyvar num =int((var1 time -var2 time )/60000) - omregnet til hele minutter Trækker to time-variable fra hinanden. Resultatet kommer umiddelbart i millisekunder, men kan naturligvis bare omregnes Nyvar num =int((var1 time -var2 time )/ ) - omregnet til hele timer Nyvar num =int((var1 time -var2 time )/ ) - omregnet til hele døgn Nyvar time =var1 time - hms(var2 num,00,00) Nyvar time =var1 time - hms(00,var2 num,00) Nyvar time =var1 time - hms(00,00,var2 num ) Nyvar time =var1 time +hms(var2 num,00,00) Nyvar time =var1 time +hms(00,var2 num,00) Nyvar time =var1 time +hms(00,00,var2 num ) - valide var2 num værdier: valide var2 num værdier: valide var2 num værdier: valide var2 num værdier: valide var2 num værdier: valide var2 num værdier: Trækker et antal timer, minutter eller sekunder fra en time-variabel Lægger et antal timer, minutter eller sekunder til en time-variabel format var time %tc : Formater f.eks: til 15jun :25:00 ( er tidsrummet fra den 1/ klokken 00:00:00 til den 15/ klokken 12:25:00 i millisekunder!!) Formaterer en time-variabel til noget læsbart. Det er ikke umiddelbart muligt/hensigtsmæssigt at skjule datoen i en time-variabel. 9

10 MISSING VALUES Stata opererer med een numerisk system missing value (.) - denne værdi er større end enhver valid værdi! I tillæg hertil har Stata 26 user missing values:.a,.b,.c....z Samlet gælder at: [valide værdier] <. <.a <.b <.c <....z Til stenge benyttes tom streng ( ) som missing value. Man kan selvfølgelig beslutte egne missing value strenge. F.eks. na (= not available) mvdecode Var(s), mv(miss_val) mvdecode Var(s), mv(miss_val1=. \ miss_val2=.a) mvdecode hoejde, mv(99) mvdecode hoejde, mv(99=. \ 88=.a) : Underforstået: 99=. (99 -> system missing (.)) : 99 -> system missing, 88 -> user-missing (.a) Omkodning af udvalgte værdier til Stata missings -det samme kan eventuelt gøres med alm. Recode (Recode hoejde (99=.)(88=.a)) egen Nyvar num =robs(var(s)) : Nyvar tildeles for hver observation/case, antal variable med valide-værdier blandt de listede egen nvalid=robs(hoejde vaegt alder koen) (i eks max 4) egen Nyvar num =rmiss(var(s)) : Nyvar tildeles for hver observation/case, antal variable med missing-værdier blandt de listede egen nmiss=rmiss(hoejde vaegt alder koen) (i eks max 4) impute Var afh Var(s) uafh, generate(nyvar) impute hoejde vaegt alder koen, generate(r_hoejde) Optælling af valide værdier (f.eks. i skalaer) Optælling af missing værdier (f.eks. i skalaer) Imputering Udfyldning af missing-værdier udfra regressions beregning med associerede variable. OBS: een af flere kontroversielle metode til at oparbejde data!! System missing (.) kan ikke tildeles en value label. Det kan derimod de øvrige missing values (.a,.b,.c....z) se eventuelt: Dokumentation (label define/label values) 10

11 DESKRIPTIV STATISTIK Hvad har du? Hvad vil du? Kontinuerte (normalfordelte) Kategoriske (rank score) eller Kontinuerte (ikke normalfordelte) Dikotome/Kategoriske Teste var for normalitet Visuel vurdering udfra plots, tommelfinger-regel eller Shapiro-Wilk qnorm var histogram var, normal swilk var (obs: ringe styrke) Beskrive var(s) N, Mean, SD, Min, Max tabstat vars, statistics (n mean sd min max) N, Median, interquartile range tabstat vars, statistics (n median iqr) Proportion (frequency) tab1 vars summarize vars tab1 vars * ved kategoriske data N, Mean, SEM, 95%CI N, Percentile (default 50), 95%CI ci vars centile vars Beskrive var(s) i subgrupper (strata) N, Mean, SD, Min, Max bysort strata-var: tabstat var, statistics (n mean sd min max) N, Median, interquartile range bysort strata-var: tabstat var, statistics (n median iqr) Proportion (frequency) bysort strata-var: tab1 vars bysort strata-var: summarize vars tab2 var strata-var N, Mean, SEM, 95%CI N, Percentile (default 50), 95%CI bysort strata-var: ci vars bysort strata-var: centile vars Tabeller flyttes bedst fra STATA (result) over i Excel ved at : Markere tabel området (og kun tabel området!) Højre klikke og vælge copy as table Skifte til Excel og taste Ctrl+V ved den ønskede placering 11

12 ANALYTISK STATISTIK Hvad vil du? Kontinuerte (normalfordelte) Hvad har du? Kategoriske (rank score) eller Kontinuerte (ikke normalfordelte) Dikotom Teste var i 2 grupper Unpaired t test ttest var 1, by (var gruppe ) Mann-Whitney test ranksum var 1, by (var gruppe ) Fisher s test tabulate var gruppe var 1, exact Teste var1 mod var2 Paired t test ttest var 1 == var 2 (ttest var 1 == var 2, unpaired) Wilcoxon test signrank var 1 =var 2 McNemar s test mcc var 1 var 2 Teste var i 3+ grupper (unmatched) One-way ANOVA oneway var 1 var gruppe (evt anova) Kruskal-Wallis test kwallis var 1, by (var gruppe ) Chi-square test tabulate var gruppe var 1, chi2 Teste var i 3+ grupper (matchede grupper) Repeated-measures ANOVA anova var1 var2 var3, repeated(var3) Friedmann test Cochrane Q Kvantificere association mellem 2 variable Pearsons correlation Spearman correlation spearman var 1 var 2 Contingency coefficientsn Prædiktere værdier udfra én anden variabel Simple linear regression/ Nonlinear regression regress var 1 var 2 predict pvar Nonparametric regression Simple logistic regression logistic var 1 var 2 predict pvar Prædiktere værdier udfra flere andre variabel Multiple linear regression / Multiple nonlinear regression Multiple logistic regression 12

13 GRAFER I/II Hvad har du? primær (x-akse) variable Hvad vil du? Dikotom Ex: ja/nej, mand/kvinde Kategorisk Ex: Vældig godt, godt, mindre godt, dårligt Kontinuert Ex: BMI, Højde, Vægt 1 Dimension histogram var 1, discrete histogram var 1, discrete histogram var 1 (gen dummy=1) graph bar (count) dummy, over(var 1 ) (gen dummy=1) graph bar (count) dummy, over(var 1 ) antal antal fordeling fordeling Dikotom histogram var 1, by(var 2 ) histogram var 1, by(var 2 ) histogram var 1, by(var 2 ) (gen dummy=1) graph bar (count) dummy, over(var 1 ) over(var 2 ) (gen dummy=1) graph bar (count) dummy, over(var 1 ) over(var 2 ) asyvars stack 2 Dimensioner Kategorisk procent (gen dummy=1) graph bar (count) dummy, over(var 1 ) over(var 2 ) asyvars stack percent procent (gen dummy=1) graph bar (count) dummy, over(var 1 ) over(var 2 ) asyvars stack percent Kontinuert mean graph dot (mean) var 2, over(var 1 ) vertical mean graph dot (mean) var 2, over(var 1 ) vertical Scatter var 1 var graph bar (mean) var 2, over(var 1 ) graph bar (mean) var 2, over(var 1 ) 13

14 GRAFER II/II ytitle("eksempel på ytitle",size(medium *) )) ylabel(1(0.5)4) title("eksempel på title",size(large *) )) subtitle("subtitle eksempel",size(medium *) )) eksempel på ytitle 1 1,5 2 2,5 3 3,5 4 eksempel på note eksempel på caption note( eksempel på note, size(medium *) )) caption( eksempel på caption ) eksempel på title subtitle eksempel 1 2 eksempel på legend title mean of ls02 Labelsizes ( *) ) kan antage 23 værdier, mest oplagt : Tiny Small Medium Large Huge Samlet graf eksempel: graph bar (mean) var, over(gruppe) /// title("eksempel på title",size(large)) /// subtitle("subtitle eksempel",size(medium)) /// ytitle("eksempel på ytitle",size(medium)) /// ylabel(1(0.5)4) /// note( eksempel på note, size(medium)) /// caption( eksempel på caption ) /// legend(on) /// legend(title(eksempel på legend title,size(medium))) legend(on) / legend(off) legend(title( eksempel på legend title,size(medium *) ))) set scheme scheme set scheme s2mono default s2color s2mono s2manual s2gmanual s1color s1mono s1rcolor s1manual sj economist s2color8 Vælg graf-scheme (skabelon) Stata har en række fordefinerede schemes. Navnlig i forbindelse med print kan der være god ide i at eksperimentere med at finde det scheme som tager sig bedst ud på den aktuelle printer. graph save [graph_name].gph, asis graph use [graph_name].gph Gem/hent en graf Grafer kan gemmes og hentes frem senere. asis (as is) gemmer grafen med scheme indstillinger, således at grafen altid vil ligne sig selv uanset program (scheme-) opsætning graph combine [graph_name1].gph [graph_name2].gph Kombinér Gemte grafer (2 eller flere) kan sættes sammen til een, som så samlet kan cut n pastes ind i tekstbehandling eller Power-Point præsentation. Fra version 10 kan man opnå yderligere kontrol med grafers udseende via Graph editor (højreklik på graf og vælg Start Graph Editor ) disse tilretninger forbliver dog udokumenterede og lader sig ikke umiddelbart reproducere via DO-files 14

15 GENEREL KOMMANDO-OPBYGNING [prefix:] kommando [varlist] [if] [in] [weight] [, option] Hvad skal der gøres? Hvad (hvilke variable) skal det gøres på? Hvem (hvilke observationer) skal det gøres på? Evt. ekstra bonus materiale Eks #1 tabulate alder if alder<64, missing Kommando Betingelse Option Tabulér (lav frekvenstabel over) aldersfordeling blandt alle der er yngre end 64 år vis også missing i tabellen Eks #2 generate alder_i_år=int(alder_i_dage/365.25) Kommando Funktion Generér (beregn) alder_i_år som heltalsdelen (obs. funktion: int() ) af alder_i_dage divideret med Eks #3 bysort sex: mean alder_i_år, level(90) Præfix Kommando Option Fordelt på sex (køn); lav opgørelse over gennemsnit alder (med SEM og CI) benyt 90% ved beregning af confidensinterval OBS: Næsten alle kommandoer i STATA har en tilhørende dialogbox (db), med indbygget vejledning: db kommando - ved at bruge db undgås behov for at huske myriader af options 15

16 LOGISKE UDTRYK (BETINGELSER) Logiske udtryk er forespørgsler som returnerer: sand eller falsk. Hovedanvendelsen ligger i betingelser (if...) f.eks. i forbindelse med: - betingede regneudtryk - opdeling (stratificering) af analyser - opdeling (stratificering) af grafer. Logiske udtryk kan bestå af flere del-forespørgsler, som hæftes sammen af de logiske operatorer: AND (&) og/eller OR ( ) Var >... Var <... Var >=... Var <=... Var ==... Var!=... (eks: alder>14) (eks: alder<64) (eks: alder>=15) (eks: alder<=63) (eks: alder==50) (eks: alder!=50) : større end : mindre end : større end/lig med : mindre end/lig med : Lig med : forskellig fra (NOT lig med) Relationelle operatorer De mest overraskende er vel: == (lig med) og!= (NOT lig med)... som tit forveksles med hhv: = (kun korrekt i forbindelse med beregninger) og <> (som betyder forskellig fra i de fleste programmer) &! : og (evt: [Alt] + [0] [3] [8]) : eller (evt: [Alt] + [1] [2] [4]) : NOT (evt: [Alt] + [0] [3] [3]) Logiske operatorer Vær generelt opmærksom omkring brugen af parenteser, når (or) indgår (= brug parenteser aktivt!!). Eks #1 ifalder_i_år<=65 & indkomst> beregn/omkod/tabuler/?? HVIS alder_i_år er 65 eller mindre OG indkomst er større end Eks #2 ifsocial_kode==3 social_kode==4 beregn/omkod/tabuler/?? HVIS social_kode er 3 ELLER 4 Tip: Ved længere lister af alternativer kan man istedet angive: if inlist(social_kode,3,4,5,8,9) Eks #3 list cpr hojde vaegt if bmi>30 list cpr, højde og vægt HVIS høj bmi (større end 30) - list cpr hojde vaegt if bmi>30 & bmi<. med: & bmi<. sikres at missing bmi ikke listes 16

17 STATA SOM REGNEMASKINE (IMMEDIATE COMMANDS) display regne-udtryk display 5+5 Beregning af regne-udtryk uafhængigt af data i data editoren. Regne-udtrykket kan være naturligvis være langt mere kompliceret end det viste. cii n y cii csi a c b d csi Binomial Exact -- Variable Obs Mean Std. Err. [95% Conf. Interval] Exposed Unexposed Total Cases Noncases Total Risk Point estimate [95% Conf. Interval] Risk difference Risk ratio Attr. frac. ex Attr. frac. pop chi2(1) = Pr>chi2 = Estimation af proportioner Estimation af Relativ risiko & Risiko (Cohort studies) Obs kommando: set level 90 vil frembringe 90% CI i div. output iri nevent1 nevent0 risktime1 risktime0 iri Exposed Unexposed Total Cases Person-time Incidence Rate Point estimate [95% Conf. Interval] Inc. rate diff Inc. rate ratio (exact) Attr. frac. ex (exact) Attr. frac. pop (midp) Pr(k>=139) = (exact) (midp) 2*Pr(k>=139) = (exact) Estimation af incidence rate ratio & rate differens cci a c b d cci Proportion Exposed Unexposed Total Exposed Cases Controls Total Point estimate [95% Conf. Interval] Odds ratio (exact) Attr. frac. ex (exact) Attr. frac. pop chi2(1) = Pr>chi2 = Estimation af odds ratio (Case-control studies) Der er mange flere kommandoer af samme slags, brug: findit immediate - for en oversigt 17

18 YDERLIGERE RESSOURCER Som nævnt tidligere, findes et kæmpe internet community omkring Stata kommandoen findit kan være meget nyttig til at finde frem til funktioner som ikke lige findes i grundpakken findit sf36 Søger (og finder) do-file som kan score SF-36 data findit confidence limit plot findit do2htm Søger (og finder) blandt andet: eclplot.do, som laver Cochrane plots dvs: meta-analyse oversigter over punktestimater med tilhørende confidens intervaller. Søger (og finder): grss.do, som står for graphic slide show en funktion som kanaliserer grafer over i et show som kan gennemses. I tilgift findes do2htm.do, som kanaliserer alt output (inklusiv grafik!) over i et htm-dokument, som er meget print venligt. søg og du skal finde! findit net search lookfor Søg i aktuelle datasæt (variable) Søg officielle Stata (funktioner) Søg google-like (funktioner) 18

19 EGNE NOTATER 19

20 20

21 21

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Århus 6. februar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Til disse øvelser har I brug for fishoil1.dta, der indeholder data fra det fiskeolie forsøg vi så på ved

Læs mere

Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner

Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Indledning... 1 Hukommelse... 1 Simple beskrivelser... 1 Data manipulation... 2 Estimation af proportioner... 2 Estimation af rater... 2 Estimation

Læs mere

Stikordsregister. (c) = kommando

Stikordsregister. (c) = kommando Stikordsregister (c) = kommando Symboler!= (forskellig fra) Se operatorer &-operatoren Se operatorer /* */ (kommentering) Se do-file // (kommentering) Se do-file /// (line join indicator) 41, 96 -operatoren

Læs mere

Statistik kommandoer i Stata opdateret 22/ Erik Parner

Statistik kommandoer i Stata opdateret 22/ Erik Parner Statistik kommandoer i Stata opdateret 22/4 2008 Erik Parner Indledning... 1 Simple beskrivelser... 1 Data manipulation... 1 Estimation af proportioner... 2 Estimation af rater... 2 Estimation af Relativ

Læs mere

Statistik FSV 4. semester 2014 Holdundervisning Uge 1: 4. februar Introduktion til Stata

Statistik FSV 4. semester 2014 Holdundervisning Uge 1: 4. februar Introduktion til Stata Århus 27. januar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Holdundervisning Uge 1: 4. februar Introduktion til Stata Hvad er Stata? Stata er et program, der kan lave statistiske analyser af

Læs mere

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse 1. Hvor stor en andel af deltagerne var mænd? Var der samme andel i de tre randomiseringsgrupper?.

Læs mere

Introduktion til SPSS

Introduktion til SPSS Introduktion til SPSS Øvelserne på dette statistikkursus skal gennemføres ved hjælp af det såkaldte SPSS program. Det er erfaringsmæssigt sådan, at man i forbindelse af øvelserne på statistikkurser bruger

Læs mere

Stolpediagrammer for kategoriske data med -catplot-

Stolpediagrammer for kategoriske data med -catplot- Stolpediagrammer for kategoriske data med -catplot- [Revideret 4. oktober 2013] Kim Mannemar Sønderskov Institut for Statskundskab, Aarhus Universitet ks@ps.au.dk Denne note gennemgår, hvordan resultaterne

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse Øvelser i epidemiologi og biostatistik, 12. april 21 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse 1. Belys ud fra data ved 5 års follow-up den fordom, at der er flere

Læs mere

Statistik (deskriptiv)

Statistik (deskriptiv) Statistik (deskriptiv) Ikke-grupperede data For at behandle ikke-grupperede data i TI, skal data tastes ind i en liste. Dette kan gøres ved brug af List, hvis ikon er nr. 5 fra venstre på værktøjsbjælken

Læs mere

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes

Læs mere

Basal statistik. 30. januar 2007

Basal statistik. 30. januar 2007 Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Oprettelse af Titelblok i Capture og Capture CIS

Oprettelse af Titelblok i Capture og Capture CIS e-service Titelblok i OrCAD Capture og Capture CIS Side 1 af 11 Oprettelse af Titelblok i Capture og Capture CIS Note skrevet af : Nordcad Systems Technical Support Revision : April 2003, Release 14.2/9.2.3,

Læs mere

Klargøring af data til aflevering til DDA. Instruks

Klargøring af data til aflevering til DDA. Instruks v Klargøring af data til aflevering til DDA Instruks Denne instruks gennemgår datadokumentationsformater m.v. for datasystemfiler, som skal afleveres til Dansk Data Arkiv efter indgået aftale om ekstern

Læs mere

SPSS introduktion Om at komme igang 1

SPSS introduktion Om at komme igang 1 SPSS introduktion Om at komme igang 1 af Henrik Lolle, oktober 2003 Indhold Indledning 1 Indgang til SPSS 2 Frekvenstabeller 3 Deskriptive statistikker gennemsnit, standardafvigelse, median osv. 4 Søjlediagrammer

Læs mere

Morten Frydenberg 25. april 2006

Morten Frydenberg 25. april 2006 . gang: Introduktion til Logistisk Regression Morten Frydenberg 26 Afdeling for Biostatistik, Århus Universitet MPH. studieår specialmodul 4 Cand. San. uddannelsen. studieår Hvorfor logistisk regression

Læs mere

Hvorfor SAS Kort intro til SAS

Hvorfor SAS Kort intro til SAS Hvorfor SAS Kort intro til SAS Efterår 2015 Janne Petersen Judith L Jacobsen Lene Theil Skovgaard Kan alt Alle ph.d. studerende har gratis adgang Fra universitetet eller hospitalerne Kode --- hjælp fra

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Kort intro til SAS. Efterår 2015. Janne Petersen Judith L Jacobsen Lene Theil Skovgaard

Kort intro til SAS. Efterår 2015. Janne Petersen Judith L Jacobsen Lene Theil Skovgaard Kort intro til SAS Efterår 2015 Janne Petersen Judith L Jacobsen Lene Theil Skovgaard 1 Hvorfor SAS Kan alt Alle ph.d. studerende har gratis adgang Fra universitetet eller hospitalerne Kode --- hjælp fra

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Kommentarer til øvelser i basalkursus, 2. uge

Kommentarer til øvelser i basalkursus, 2. uge Kommentarer til øvelser i basalkursus, 2. uge Opgave 2. Vi betragter målinger af hjertevægt (i g) og total kropsvægt (målt i kg) for 10 normale mænd og 11 mænd med hjertesvigt. Målingerne er taget ved

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Begreber. Parrede sammenligninger. Lene Theil Skovgaard 5. september 2017 1 / 16 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

DST SIKKERHED OG ANVENDELSE

DST SIKKERHED OG ANVENDELSE VER 1.3 Introduktion til brug af DST Ansøgning om adgang DEN PERSONLIGE ADGANG Hvordan kommer jeg på? Hvordan nedtager jeg informationer? HVAD ER REGLERNE FOR NEDTAGNING AF INFORMATIONER? Brud, sanktioner

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Table of Contents. Prøveværktøj

Table of Contents. Prøveværktøj PRØVEVÆRKTØJ Table of Contents Opret prøve og tilpas dit fronter-rum... 3 Opret prøve... 4 Tilføj prøveværktøj... 6 Fanen "Indstillinger"... 11 Indstillinger for vindue... 15 Mappe til billeder/multimedier...

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Regressionsanalyse. Lene Theil Skovgaard 5. februar 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Indlæsning og

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Opret prøve og tilpas dit fronter-rum Spørgsmålstyper og justering Oversigt over spørgsmålstyper...20 Justering af spørgsmål og sider...

Opret prøve og tilpas dit fronter-rum Spørgsmålstyper og justering Oversigt over spørgsmålstyper...20 Justering af spørgsmål og sider... PRØVEVÆRKTØJ Table of Contents Opret prøve og tilpas dit fronter-rum... 3 Opret prøve... 4 Tilføj prøveværktøj... 6 Fanen "Indstillinger"...11 Indstillinger for vindue...15 Mappe til billeder/multimedier...17

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for Biokemikere, Blok januar 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet

Læs mere

Indledning. På de følgende sider vises, primært i tegneserieform, lidt om mulighederne i PC-AXIS for Windows.

Indledning. På de følgende sider vises, primært i tegneserieform, lidt om mulighederne i PC-AXIS for Windows. Indledning PC-AXIS for Windows er et talbehandlingsprogram, der kan håndtere store mængder statistisk materiale. PC-AXIS giver mulighed for at arbejde videre med det statistiske materiale i egne programmer

Læs mere

Kapitel 4 Løkker i C#

Kapitel 4 Løkker i C# Kapitel 4 Løkker i C# Løkker en vigtig del af alle programmeringssprog, og C# er ikke andeles. En løkke er en måde at udføre en del af koden gentagne gange. Ideen er at du fortsætter med at udføre en opgave

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Multipel regression. Lene Theil Skovgaard 10. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Figurer: s.

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Program dag 2 (11. april 2011)

Program dag 2 (11. april 2011) Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge;

Læs mere

HOFTEALLOPLASTIK - DATAUDTRÆK OG IMPORT TIL EXCEL

HOFTEALLOPLASTIK - DATAUDTRÆK OG IMPORT TIL EXCEL HOFTEALLOPLASTIK - DATAUDTRÆK OG IMPORT TIL EXCEL Når man er logget på KMS systemet, vælges Dataudtræk under punktet Vælg modul, hvorefter der klikkes på Gå til: På næste side klikkes på knappen Opret:

Læs mere

Afdeling for Anvendt Matematik og Statistik December 2006

Afdeling for Anvendt Matematik og Statistik December 2006 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 i SAS (Zar kapitel 23) PROC FREQ PROC CATMOD

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

FORGRENINGSLOGIK OG CALCULATED FIELDS. Opsætning af forgreningslogik Felttypen Calculated field

FORGRENINGSLOGIK OG CALCULATED FIELDS. Opsætning af forgreningslogik Felttypen Calculated field FORGRENINGSLOGIK OG CALCULATED FIELDS Opsætning af forgreningslogik Felttypen Calculated field Felt-referencer i REDCap Når man anvender forgreningslogik, beregnede felter eller piping i REDCap, refererer

Læs mere

Åbn Paint, som er et lille tegne- og billedbehandlingsprogram der findes under Programmer i mappen Tilbehør. Åbn også Word.

Åbn Paint, som er et lille tegne- og billedbehandlingsprogram der findes under Programmer i mappen Tilbehør. Åbn også Word. 75 Paint & Print Screen (Skærmbillede med beskæring) Åbn Paint, som er et lille tegne- og billedbehandlingsprogram der findes under Programmer i mappen Tilbehør. Åbn også Word. 1. Minimer straks begge

Læs mere

DST SIKKERHED OG ANVENDELSE

DST SIKKERHED OG ANVENDELSE VER 1.6 15. GUST 2016 Introduktion til brug af DST Ansøgning om adgang DEN PERSONLIGE ADGANG Hvordan kommer jeg på? Hvordan nedtager jeg informationer? HVAD ER REGLERNE FOR NEDTAGNING AF INFORMATIONER?

Læs mere

PROC TRANSPOSE. SAS-tabellen - hensigtsmæssig lagring af data. Copyright 2011 SAS Institute Inc. All rights reserved.

PROC TRANSPOSE. SAS-tabellen - hensigtsmæssig lagring af data. Copyright 2011 SAS Institute Inc. All rights reserved. PROC TRANSPOSE SAS-tabellen - hensigtsmæssig lagring af data Copyright 2011 SAS Institute Inc. All rights reserved. Transponerede tabeller Brede eller smalle? Hvad: Brede tabeller har mange kolonner med

Læs mere

R E D C A P M A N U A L. Importér data til REDCap fra CSV-fil. Opbyg din eksisterende database i REDCap Version 1.0

R E D C A P M A N U A L. Importér data til REDCap fra CSV-fil. Opbyg din eksisterende database i REDCap Version 1.0 R E D C A P M A N U A L Importér data til REDCap fra CSV-fil Opbyg din eksisterende database i REDCap Version 1.0 Introduktion Der opstår ofte et ønske om at importere data fra andre databaser til REDCap,

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

Datatransport... 2. Import & Eksport af data... 2. Generelt... 2. Import/eksport... 4. Felter i Import og Eksport... 5

Datatransport... 2. Import & Eksport af data... 2. Generelt... 2. Import/eksport... 4. Felter i Import og Eksport... 5 Indhold Datatransport... 2 Import & Eksport af data... 2 Generelt... 2 Import/eksport.... 4 Felter i Import og Eksport... 5 Trykknapper til Import og Eksport... 7 1 Alle... 7 2 Slet... 7 3 Editor... 7

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Arbejde med Regioner Lister, Playlists, og Cutlists i Sound Forge Pro

Arbejde med Regioner Lister, Playlists, og Cutlists i Sound Forge Pro Arbejde med Regioner Lister, Playlists, og Cutlists i Sound Forge Pro Gary Rebholz Du har sikkert allerede ved, at Sound Forge Pro software kan bruges til en imponerende række af audio opgaver. Alt fra

Læs mere

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)

Læs mere

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018 Faculty of Health Sciences Basal Statistik Logistisk regression mm. Lene Theil Skovgaard 5. marts 2018 1 / 22 APPENDIX vedr. SPSS svarende til diverse slides: To-gange-to tabeller, s. 3 Plot af binære

Læs mere

E-time kursus. Kursus indhold 1

E-time kursus. Kursus indhold 1 Kursus indhold 1 Installation af softwaren. Opsætning til et løb. Hent data fra O-service Klargøring i regneark Særlige hensyn vedrørende B-løb Importere data til løbet Aktivere en backup af løbet Planlægning

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet Projekt 1 Spørgeskemaanalyse af Bedst på Nettet D.29/2 2012 Udarbejdet af: Katrine Ahle Warming Nielsen Jannie Jeppesen Schmøde Sara Lorenzen A) Kritik af spørgeskema Set ud fra en kritisk vinkel af spørgeskemaet

Læs mere

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje.

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje. Maple Dette kapitel giver en kort introduktion til hvordan Maple 12 kan benyttes til at løse mange af de opgaver, som man bliver mødt med i matematiktimerne på HHX. Skærmbilledet Vi starter med at se lidt

Læs mere

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning Statistik Introduktion Deskriptiv statistik Sandsynslighedregning Introduktion Kasper K. Berthelsen, Institut f. Mat. Fag 8 Kursusgange Individuel mundtlig eksamen (7-skala) Udgangspunkt i opgaver Software:

Læs mere

9. Chi-i-anden test, case-control data, logistisk regression.

9. Chi-i-anden test, case-control data, logistisk regression. Biostatistik - Cand.Scient.San. 2. semester Karl Bang Christensen Biostatististisk afdeling, KU kach@biostat.ku.dk, 35327491 9. Chi-i-anden test, case-control data, logistisk regression. http://biostat.ku.dk/~kach/css2014/

Læs mere

R / RStudio. Intro til R / RStudio

R / RStudio. Intro til R / RStudio R / RStudio Intro til R / RStudio R R er et open source statstikprogram og programmeringssprog introduceret i 1993. Seneste version er 2.15.3 R kan downloades på www.r-project.org R er i udgangspunktet

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model Epidemiologi og biostatistik. Uge 5, torsdag. marts 1 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Det statistiske

Læs mere

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere Epidemiologi og biostatistik. Uge 5, torsdag 5. september 003 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver

Læs mere

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp

Læs mere

Morten Frydenberg 14. marts 2006

Morten Frydenberg 14. marts 2006 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen

Læs mere

ØVELSE 2B. Formål Det primære formål med denne øvelse er at prøve nogle vigtige procedurer til statistisk og grafisk analyse.

ØVELSE 2B. Formål Det primære formål med denne øvelse er at prøve nogle vigtige procedurer til statistisk og grafisk analyse. ØVELSE 2B I denne øvelse gennemgår vi: Udskrivning ved hjælp af PUT. Procedurerne FREQ, UNIVARIATE og CORR. Overførsel af procedure-uddata til et datasæt. Fremstilling af histogrammer og XY-plots. Formål

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Øvelser til basalkursus, 2. uge

Øvelser til basalkursus, 2. uge Øvelser til basalkursus, 2. uge Opgave 1 Vi betragter igen Sundby95-materialet, og skal nu forbedre nogle af de ting, vi gjorde sidste gang. 1. Gå ind i ANALYST vha. Solutions/Analysis/Analyst. 2. Filen

Læs mere

OPBYGNING AF INSTRUMENTER. Online Designeren Record ID Felttyper Validering og variabelnavne

OPBYGNING AF INSTRUMENTER. Online Designeren Record ID Felttyper Validering og variabelnavne OPBYGNING AF INSTRUMENTER Online Designeren Record ID Felttyper Validering og variabelnavne Online Designer Online designeren er det primære værktøj til at opbygge skemaet til dataindsamling. I REDCap

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes

Læs mere

APPENDIX A INTRODUKTION TIL DERIVE

APPENDIX A INTRODUKTION TIL DERIVE APPENDIX A INTRODUKTION TIL DERIVE z x y z=exp( x^2 0.5y^2) CAS er en fællesbetegnelse for matematikprogrammer, som foruden numeriske beregninger også kan regne med symboler og formler. Det betyder: Computer

Læs mere

Brug af Discoverer. 1. Start Discoverer ved at klikke på knappen Discoverer på

Brug af Discoverer. 1. Start Discoverer ved at klikke på knappen Discoverer på Oprette projektark med simpel tabel Brug af Discoverer 1. Start Discoverer ved at klikke på knappen Discoverer på www.kirkeportal.dk 2. Angiv kontonummer, brugernavn og password. Det er det samme som anvendes

Læs mere

KURSUS I ANALYSEPORTALEN (AP) DANSK PALLIATIV DATABASE 3 1. ÅBNING AF ANALYSEPORTALEN 3 2. OPRETTELSE AF EN RAPPORT DVS. START AF DATAANALYSE 4

KURSUS I ANALYSEPORTALEN (AP) DANSK PALLIATIV DATABASE 3 1. ÅBNING AF ANALYSEPORTALEN 3 2. OPRETTELSE AF EN RAPPORT DVS. START AF DATAANALYSE 4 KURSUS I ANALYSEPORTALEN (AP) DANSK PALLIATIV DATABASE 3 1. ÅBNING AF ANALYSEPORTALEN 3 2. OPRETTELSE AF EN RAPPORT DVS. START AF DATAANALYSE 4 3. VALG AF DATA 5 4. BEHANDLING OG VISNING AF DATA 7 1 Liste

Læs mere

Seniorkursus i Biostatistik og Stata, Dag 2

Seniorkursus i Biostatistik og Stata, Dag 2 SENIORKURSUS STATA OG BIOSTATISTIK Aarhus Universitet juni DAGENS TEMA: SAMMENLIGNINGER FORMIDDAG: KONTINUERTE DATA EFTERMIDDAG: KATEGORISKE DATA STATISTISK ANALYSE AF TO UAFHÆNGIGE STIKPRØVER FRA NORMALFORDELTE

Læs mere

Manual Version 2. til oprettelse af hjemmesider for landsbyer i Rebild kommune

Manual Version 2. til oprettelse af hjemmesider for landsbyer i Rebild kommune Manual Version 2 til oprettelse af hjemmesider for landsbyer i Rebild kommune Oversigt: Login Hjemmeside...... side 3 Login Administrationsmodul... side 5 Kategorier.. side 6 Opret/rediger første side...

Læs mere

Pivottabeller, diagrammer og databehandling. Underviser: Nina Kirkegaard Schou Mobil

Pivottabeller, diagrammer og databehandling. Underviser: Nina Kirkegaard Schou Mobil Pivottabeller, diagrammer og databehandling Underviser: Nina Kirkegaard Schou Mobil 21 48 65 16 E-mail: ns@teamcrm.dk Emner: Excel Pivottabeller/diagrammer og databehandling Brugerfladen Import af data

Læs mere

ALMINDELIGT ANVENDTE FUNKTIONER

ALMINDELIGT ANVENDTE FUNKTIONER ALMINDELIGT ANVENDTE FUNKTIONER I dette kapitel gennemgås de almindelige regnefunktioner, samt en række af de mest nødvendige redigerings- og formateringsfunktioner. De øvrige redigerings- og formateringsfunktioner

Læs mere

Tilpas: Hurtig adgang

Tilpas: Hurtig adgang Tilpas: Hurtig adgang Genveje, Se skærmtips Se tips Hold alt tasten nede. Og brug bogstaver Word Fanen Filer PDF dokument Brug skabelon Visninger Husk Luk ved fuldskærmsvisning Brug zoom skyder Marker,

Læs mere

Tips og tricks til Proc Means. Per Andersen

Tips og tricks til Proc Means. Per Andersen Tips og tricks til Proc Means Capgemini gruppen Grundlagt 1967 i Paris, startet i Danmark 1984 Omsætning på verdensplan i 2008 8,7 milliader euro 91.600 medarbejdere på verdensplan, heraf 300 i Danmark

Læs mere

Easy Guide i GallupPC

Easy Guide i GallupPC Easy Guide i GallupPC Version. 6.00.00 Gallup A/S Masnedøgade 22-26 DK 2100 København Ø Telefon 39 27 27 27 Fax 39 27 50 80 Indhold SÅDAN KOMMER DU I GANG MED AT ANVENDE GALLUPPC... 2 TILFØJELSE AF UNDERSØGELSER

Læs mere

Google Apps. Lær at oprette, organisere, dele og slette dokumenter. Udarbejdet af PLC, version 2013!!!!!!! Side 1 af 9

Google Apps. Lær at oprette, organisere, dele og slette dokumenter. Udarbejdet af PLC, version 2013!!!!!!! Side 1 af 9 Lær at oprette, organisere, dele og slette dokumenter. Udarbejdet af PLC, version 2013!!!!!!! Side 1 af 9 Arbejde i faner Google Apps arbejder i faner, derfor er det vigtigt, du er bekendt med det. Mappen

Læs mere

SAS formater i Danmarks Statistik

SAS formater i Danmarks Statistik Danmarks Statistik, Forskningsservice og Kundecenter 9. januar 2012 SAS formater i Danmarks Statistik 1. Indledning... 1 2. Hvor findes formater og øvrige datafiler?... 2 3. Hvordan bruges formater i SAS-programmet?...

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere