23. februar Epidemiologi og biostatistik. Uge 5, mandag 27. februar 2006 Michael Væth, Institut for Biostatistik.
|
|
- Bertram Karlsen
- 6 år siden
- Visninger:
Transkript
1 ... februar 1 Eidemiologi og biostatistik. Uge, mandag. februar Michael Væth, Institut for Biostatistik. Ikke arametrisk statistiske test : Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kalan-Meyer kurver Den basale idé: rangordning Co roortional hazard model To gruer: Mann-Whitney / Wilcoon testet Parret data (symmetrisk fordeling): Wilcoon signed rank Association: Test baseret å Searman s rang korrelation Det statistiske modelbegreb Modelselektion Ikke-arametrisk statistiske test Ikke-arametriske test (ordinale data) Hidtil (arametrisk statistik): Ukendt størrelse (arameter) f.eks OR, middelfødselsvægt eller lign. Estimat og standard error. Sikkerhedsinterval. Hyotese (f OR = 1). Test baseret å z = (estimat-hyotese)/se. Resultaterne bygger å en statistisk model. Baseres ikke å et arameter estimat. Men ofte å de rangordnede data. Bygger også å statistiske modeller. Men der er svagere antagelser bag dem. Ofte rang-test: De ræcise observationsværdier har ingen betydning. Men det har rangene: Hvilken observation er mindst Rang=1 Hvilken observation er næstmindst Rang= Hvilken observation er trediemindst Rang= osv Et eksemel å Mann-Whitney-Wilcoon test IKKE RYGER RANGORDNING RYGER Table.1 (.1) Fødselsvægt (kg) IKKE RYGER RYGER Gennemsnitsrang: Vi ønsker at teste hyotesen: Ingen forskel i fødselsvægt. ryger Idé: Sammenlign gennemsnitsrangen blandt ikke-rygere med gennemsnitsrangen blandt rygere. ikke ryger... fødselsvægt Er der forskel? Ækvivalent: Beregn forskellen mellem rangsummen blandt rygere og den rangsum, som forventes, hvis hyotesen er sand. Vurdér denne forskel i forhold til usikkerheden å rangsummen. 1
2 . februar En stor forskel vil være kritisk for hyotesen. P-værdi = sandsynligheden for at observere en større forskel under antagelse af hyotesen er sand! Beregning ved hjæl af comuter eller tabel (K&S A). -værdi=9. Konklusion: Data strider mod hyotesen. Hyotesen kan ikke acceteres! Præcist samme test hvis vi regnede å ln-data. Eller en hvilken som helst monoton transformation. Kun rangordningen betyder noget. Testet kaldes Mann-Whitney U-test eller Wilcoon two-samle test. Generelt: Mann-Whitney U-test ækvivalent med Wilcoon two samle test Data: To uafhængige sæt (ordinale) observationer. Hyotese: De to fordelinger er ens. Alternativ: De to fordelinger er forskudt i forhold til hinanden. Ide: Hvis alternativet er sandt vil gennemsnitsrangen være forskellig i de to gruer. Hvis hyotesen er sand så vil gennemsnitsrangene være næsten ens. P-værdi vha. af comuter eller tabel. Et eksemel å signed Wilcoon test En stikrøve eller arrede data Table. (.) Placebo-kontrolleret klinisk undersøgelse af soveillers betydning for søvnlængde (timer). Patient Aktiv Placebo Differens Differens Rang Rangordning af de numeriske værdi af differenserne (dvs glem fortegnet) 9 Hyotese: Ingen forskel mellem de to behandlinger. Man vil så forvente at der er cirka lige mange ositive og negative differenser og at ositive og negative differenser har ens fordelinger. Idé: Se å forskellen i sum af rangene af de ositive og negative differenser. Det samme som at se å summen af rangene i den ene grue, da summen af alle rangene kun afhænger af stikrøvens størrelse. Husk: Rangene beregnes uden fortegn. P-værdi = sandsynligheden for at observere en større forskel under antagelse af hyotesen er sand! I eksemlet sum af negative differensers range = 1 Beregning ved hjæl af comuter eller tabel (K&S A). -værdi=.. Konklusion: Data strider ikke mod hyotesen. Hyotesen kan acceteres! Ikke samme test hvis vi transformerede data inden vi beregnede differensen. F et andet resultat hvis vi så å relative forskelle. Testet hedder Wilocon signed-rank test. 11 Generelt: Wilcoon signed rank test. Data: Et sæt uafhængige observationer. Hyotese: Fordelingen er symmetrisk om. Alternativ: Fordelingen er ikke symmetrisk om. Ide: Hvis alternativet er sandt vil rangsummene for de ositive og negative tal være forskellige. Hvis hyotesen er sand så vil rangsummene være næsten ens. P-værdi vha. af comuter eller tabel. Bruges ofte ved arrede data - der regnes å differensen! 1
3 . februar Et eksemel å test for ingen sammenhæng mellem to variable (se også andet eksemel: K&S side 9-) Incidens af Kaosi's sarcoma i Tanzania 1 Forudsætninger for lineær regression ikke ofyldt! (Derfor) beregning af Pearson korrelation uden mening. Hvad så! 1 Kan vi nøjes med et test? Til en start: Ja!? Hyotese (som sædvanlig): Ingen sammenhæng. Incidens er mio år % befolkning indenfor km fra sundhedscenter Er der en sammenhæng/association? Idé: Rangordne erne samt y erne og beregn korrelation mellem rangene. Korrelation langt væk fra kritisk. P-værdi = sandsynligheden for at observere en korrelation længere væk fra under antagelse af hyotesen er sand! Beregning ved hjæl af comuter eller tabel. Korrelation mellem rangene =.. -værdi=.1 Konklusion: Data strider ikke mod hyotesen. Hyotesen kan acceteres! Incidens er mio år Incidens af Kaosi's sarcoma i Tanzania % befolkning indenfor km fra sundhedscenter 1 Generelt: Test for ingen association baseret å Searman s korrelation Data: Uafhængige ar (,y) af observationer. Hyotese: Ingen association mellem og y. Alternativ: Monoton association. Ide: Hvis alternativet er sandt vil rangene af erne være korrelerede med rangene af y erne. 1 Præcist samme test hvis vi regnede å ln() og y. Eller ln() og y. Eller en hvilkensomhelst monoton transformation. Kun rangordningerne betyder noget. Testet hedder Searman s rang korrelation Searmans rho (ρ) Searman s korrelation beregnes. Hvis hyotesen er sand så vil denne korrelation være tæt å. P-værdi vha. af comuter eller tabel. Searman s korrelation er ikke mulig at fortolke! Men testet er godt nok! y Pearson og Searman korrelationer (1) Eksemel 1 Pearson.1 Searman.99 1 y Pearson og Searman korrelationer () Eksemel Pearson. Searman. 1 Pearsons korrelationskoefficient er meget følsom overfor outliers. (i tvivl brug Searmans )
4 . februar y Pearson og Searman korrelationer () Eksemel Pearson. Searman -. Lav en tegning før Pearsons korrelationskoefficient findes! Det kan være at den er meningsløs eller misvisende! Når man læser artikler: Overvej: ved forfatterne hvad de gør! 19 Ikke arametrisk test: Godt elle skidt?? For: Svage antagelser. Kan også bruges å ordinal data som meget godt; godt; rimeligt; dårligt; meget dårligt stadieinddeling af cancer (sredning). Stort set lige så stærke som arametriske test (gælder dog ikke hvis man har få data). Imod: Der er tale om test, ingen estimater med CI. Bruges ofte bevidstløst (svage antagelser = ingen antagelser?). Kan kun bruges til simle roblemstillinger. Overlevelses (ventetids) data I follow-u studier ses ofte å ventetider: Tid til død af kræft efter kræft diagnose. Ventetid til oeration. Tid mellem galdestensoeration og fund af ny galdesten. Sådanne data er ofte censurerede, dvs man kender ikke den ræcise ventetid: Personerne dør af anden årsag end kræft. Personerne er i live da studiet slutter. Den oererede får ikke galdesten inden studiet slutter. Den oererede flytter til et andet amt/land. Mest almindeligt: Højre censurering: Vi ved kun hvornår ersonen sidst var rask/i live 1 Metoderne til analyse af højre-censurerede ventetidsdata omfatter: Kalan-Meyer lot: Metode til at beregne/tegne ventetidsfordelingen under hensyntagen til højre censureringen. Log-rank test: Tester hyotesen: Samme ventetidsfordeling i to gruer. Co s roortional hazard model: Regressions analyse af ventetids data. Giver estimater af rate ratio er å log skala. Minder meget om logistisk regression K&S eksemel.. Overlevelse for atienter med leversygdom Kalan-Meier survival estimates, by cenc Fortolkning: Kurverne er viser sandsynligheden for at være i live som funktion af tid siden behandlingsstart for de to gruer 1... Alternativ ræsentation: Risikoen for at dø som funktion af follow-u tid = 1 minus overlevelsesfunktion Kalan-Meier failure estimates, by cenc Risikoen for at dø inden dag er.%. Efter dage er chancen for at være i live.% cenc = cenc = 1. cenc = cenc = 1
5 . februar Sammenligning af overlevelsesfunktioner Definitioner og sammenhænge: Hyotese: Overlevelsesfunktionerne i de to gruer er identiske, dvs S 1 (t) = S (t) for alle t S( t ) = Overlevelse/Survival funktion Eksemlet: Outut fra en analyse med rogramakken Stata Log-rank test for equality of survivor functions Events Events cenc observed eected Total 9 9. chi(1) =. Pr>chi = Kalan-Meier survival estimates, by cenc P-værdi: Sandsynligheden er meget lille for at få to Kalan-Meier kurver som mindst lige så forskellige, hvis overlevelsen ikke afhænger af central cholestasis. Konklusion: Hyotesen S 1 (t) = S (t) for alle t forkastes cenc = cenc = 1 h(t): hazard/intensitet til tidsunktet t. sands. for at 'dø' inden t + t givet man er i live til tid t h( t) = t ( ) t S ( t) = e h( u) du Hazard funktionen beskriver den øjeblikkelige dødsrisiko er tidsenhed, dvs den teoretiske dødsrate I analyser af ventetidsdata benyttes sædvanligvis modeller som bekriver hvorledes rognostiske faktorer åvirker denne rate. Analyse af ventetidsdata med antagelse om roortionale hazards (roortionale rater) Eksemlet: Prognostisk faktor: Central cholestasis, ja (1), nej () Antag at raterne er roortionale, dvs h ( t) = θ h ( t) 1 Parameteren θ beskriver hvor meget raten for ja -gruen er forøget, dvs en rate ratio eller en hazard ratio Estimation: Et comuter rogram giver ˆ θ =. 9% CI :.,. % større dødelighed hvis man har Central Cholestasis Survival Probability Observed: cenc = Observed: cenc = 1 Predicted: cenc = Predicted: cenc = 1 Rimelig overensstemmelse Man kan udvide denne model til at tage hensyn til flere ting å en gang (som multiel/logistisk regression). Modellens arametre beskriver effekter (rate ratio er) å en log-skala En metode er Co roortional hazard model 1 θ θ θ h( t) = h ( t) 1 ( ) = ( ) e( β1 1 + β + + β ) h t h t hvor θ1 = e( β1) o.s.v. Eller ln[ h( t) ] = ln [ h ( t )] + β + β + + β 1 1 Intet konstantled (α) men i stedet kurven ln[h (t)]. ( 1,,..., ) i formlen er enten kodet (/1) fra dikotome kategoriske variable eller kontinuerte variable (vægt, bmi osv.); dette gælder også i multiel- og logistisk regression. h (t) er baseline hazard svarerende til hazardkurven for en reference erson med alle er lig. Hazard kurven for en vilkårlig erson er h ganget med e(β β β ) 9 K&S eksemel.. Overlevelse for atienter med leversygdom Vi ser å følgende tre rediktorer: Behandling: Aktiv versus lacebo Central Cholestasis, ja/nej Patientens alder i år. Sammenligner man to ersoner der er ens mht (,..., ) og med en forskel å 1 i 1 er h (t)/h (t) = e(β 1 ) = θ 1 hazard ratio (rate ratio), uafhængig af t! Dvs. konstant rate ratio. Co s roortional hazard model minder meget om logistisk regression. OUTPUT Prediktor behandling central chol alder reg.coeff s.e.1..1 HR.. 1. lower 9% CI.. 1. uer Aktiv behandling formindsker dødsraten med 1% - ikke statistisk signifikant. Alder: Dødsraten vokser med en faktor 1. er år.
6 . februar Ventetids data kan således være: Højre censureret: Vi ved, at ersonen ikke har olevet begivenheden før sidste gang vi ser ham. Men kan også være: Venstre censureret: Vi ved, at ersonen har olevet begivenheden inden vi ser ham første gang, men ikke hvornår. Interval censureret: Vi ved, at ersonen har olevet begivenheden i givet tidsinterval, men ikke hvornår. Data er ofte interval censurerede: Vi ved, atienten var rask ved forrige kontrol, men nu er han/hun syg. Vi ved ikke, hvornår det skete. Interval censurerede data er svære at analysere. 1 Der kan også være andre roblemer med data: Vi ved ikke om ersonen har olevet begivenheden inden vi ser ham første gang. Vi ved ikke om ersonen har olevet begivenheden i et givet tidsinterval. Patienter var rask ved forrige kontrol og er det også nu. Har han været syg i mellemtiden? Personer indgår kun hvis de har overlevet. Det er kun højre censurerede data, der er lette at analysere - en comuter med relevant software er dog fordel! For at bruge formlerne i K&S kaitel skal man have adgang til data for de enkelte ersoner. Bag alle beregninger af: Statistiske modeller Estimater, se, sikkerhedsintervaller, test og -værdier ligger en statistisk model. Modellen er en aroksimation til virkeligheden. Valget af model er et valg mellem: komliceret model ofte god aroksimation simel model ofte dårlig aroksimation komliceret model svær at forstå og analysere simel model let at forstå og analysere En model skal vælges så komliceret, at den ikke er helt forkert og så simel, at den er til at analysere og forstå. Modellen er tyisk baseret å antagelser, så som: de enkelte observationer er uafhængige. målefejlen er normalfordelt. variationen mellem individer er normalfordelte. Ln(odds) kan skrives som en sum af forskellige bidrag. bidraget fra alder afhænger ikke af ersonens køn. (ingen effektmodifikation) OR stiger eksonentielt med forskellen i BMI. Hvis antagelserne ikke er (næsten) rigtige bliver resultaterne værdiløse. Derfor bør en statistisk analyse altid inkludere en vurdering af om metodens forudsætninger er rimelige (modelkontrol). Modelselektion Ofte er den model man får ræsenteret i en artikel ikke den eneste forfatterne har fittet til data. Man får kun ræsenteret den bedste. Modellen er selekteret (udvalgt). Bevidst eller ubevidst. Manuelt eller automatisk (PC: Find den bedste model!). Modelselektion har (desværre) betydning for resulterne: Estimaterne er tyisk for store (for langt væk fra nul). Sikkerhedsintervallerne for smalle. P-værdierne for små.
2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik
... september 1 Epidemiologi og biostatistik. Uge, mandag. september Michael Væth, Institut for Biostatistik. Ikke parametrisk statistiske test : Analyse af overlevelsesdata (ventetidsdata) Censurering
Læs mereOR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere
Epidemiologi og biostatistik. Uge 5, torsdag 5. september 003 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver
Læs mereOR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model
Epidemiologi og biostatistik. Uge 5, torsdag. marts 1 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Det statistiske
Læs mere24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion
. februar 00 Ikke parametrisk statistiske test : Ideen bag Epidemiologi og biostatistik. Uge, mandag. februar 00 Morten Frydenberg, Institut for Biostatistik. To grupper: Mann-Whitney / Wilcoxon testet
Læs mereMorten Frydenberg Biostatistik version dato:
Tye og Tye 2 fejl Statistisk styrke Biostatistik uge 2 mandag Morten Frydenberg, Afdeling for Biostatistik Styrkeovervejelser i lanlægning af et studie Logistisk regression Præterm fødsel, rygning, alder,
Læs mereKorrelation Pearson korrelationen
-9- Eidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Korrelation Kliniske målinger - Kliniske målinger og variationskilder - Estimation af størrelsen
Læs mereMorten Frydenberg Biostatistik version dato:
Caerphilly studiet Design og Data Biostatistik uge 14 mandag Morten Frydenberg, Afdeling for Biostatistik Poisson regression En primær tidsakse og ikke stykkevise konstante rater Cox proportional hazard
Læs mereMorten Frydenberg 14. marts 2006
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen
Læs mereOverlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.
1 Levetidsanalyse Overlevelsesfunktionen Censurering Kaplan-Meier estimatoren Hazard funktionen Proportionale hazards Multipel regression PSE (I17) FSV1 Statistik - 5. lektion 1 / 19 Overlevelsesfunktionen
Læs mereStatistik kommandoer i Stata opdateret 22/ Erik Parner
Statistik kommandoer i Stata opdateret 22/4 2008 Erik Parner Indledning... 1 Simple beskrivelser... 1 Data manipulation... 1 Estimation af proportioner... 2 Estimation af rater... 2 Estimation af Relativ
Læs mere1. februar Lungefunktions data fra tirsdags Gennemsnit l/min
Epidemiologi og biostatistik Uge, torsdag 3. februar 005 Morten Frydenberg, Afdeling for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (ud
Læs mereStatistik kommandoer i Stata opdateret 16/3 2009 Erik Parner
Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Indledning... 1 Hukommelse... 1 Simple beskrivelser... 1 Data manipulation... 2 Estimation af proportioner... 2 Estimation af rater... 2 Estimation
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereLøsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Læs mere4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min
Epidemiologi og biostatistik Uge, torsdag 28. august 2003 Morten Frydenberg, Institut for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (udfra
Læs mereMorten Frydenberg 26. april 2004
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.
Læs mereEpidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april
Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et
Læs mereDag 6: Interaktion. Overlevelsesanalyse
Dag 6: Interaktion. Overlevelsesanalyse How does CHD depend on gender and hypertension? Males: hypertension chd01 Females: Frequency Row Pct 0 1 Total ---------+--------+--------+ 0 352 95 447 78.75 21.25
Læs mereIntroduktion til overlevelsesanalyse
Faculty of Health Sciences Introduktion til overlevelsesanalyse Kaplan-Meier estimatoren Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk
Læs mereStatistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
Læs mereEpidemiologi og Biostatistik
Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Læs mereResumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se
Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereLineær og logistisk regression
Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression
Læs mereØvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test
Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Formålet med øvelsen er at analysere risikoen for død forbundet med forskelligt alkoholforbrug. I denne øvelse skal analyserne foretages
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereStatistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004
Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod
Læs mereSammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.
Sammenhængsanalyser Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt. rygevaner som 45 årig * helbred som 51 årig Crosstabulation rygevaner
Læs mereBesvarelse af opgavesættet ved Reeksamen forår 2008
Besvarelse af opgavesættet ved Reeksamen forår 2008 10. marts 2008 1. Angiv formål med undersøgelsen. Beskriv kort hvordan cases og kontroller er udvalgt. Vurder om kontrolgruppen i det aktuelle studie
Læs mereStatikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Læs mereStatistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereEpidemiologiske associationsmål
Epidemiologiske associationsmål Mads Kamper-Jørgensen, lektor, maka@sund.ku.dk Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab It og sundhed l 16. april 2015 l Dias nummer 1 Sidste gang
Læs mere12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Læs mereModul 12: Regression og korrelation
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................
Læs mereStatistiske principper
Statistiske principper 1) Likelihood princippet - Maximum likelihood estimater - Likelihood ratio tests - Deviance 2) Modelbegrebet - Modelkontrol 3) Sufficient datareduktion 4) Likelihood inferens i praksis
Læs mereEpidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts
Århus 27. februar 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts Epibasic er nu opdateret til version 2.02 (obs. der er ikke ændret ved arket C-risk) Start med
Læs mereMorten Frydenberg 25. april 2006
. gang: Introduktion til Logistisk Regression Morten Frydenberg 26 Afdeling for Biostatistik, Århus Universitet MPH. studieår specialmodul 4 Cand. San. uddannelsen. studieår Hvorfor logistisk regression
Læs mereIkke-parametriske tests
Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference
Læs mereEpidemiologi og Biostatistik
Epidemiologi og Biostatistik Kliniske målinger (Kapitel. +.1 + 11.-11 + 1.1-) Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik
Læs mereTema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Læs mereOverlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.
Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mereIkke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Estimation Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev herefter
Læs mereReeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl
Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereEpidemiologiske associationsmål
Epidemiologiske associationsmål Mads Kamper-Jørgensen, lektor, maka@sund.ku.dk Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab It og sundhed l 21. april 2016 l Dias nummer 1 Sidste gang
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mereBasal Statistik Kategoriske Data
Basal Statistik Kategoriske Data 8 oktober 2013 E 2013 Basal Statistik - Kategoriske data Michael Gamborg Institut for sygdomsforebyggelse Københavns Universitetshospital michael.orland.gamborg@regionh.dk
Læs mereMultipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Læs merePostoperative komplikationer
Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mål for sammenhæng mellem to variable
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mål for sammenhæng mellem to variable Estimation Stikprøve Data Population Teori relativ hyppighed parameter estimat sandsynlighed parameter
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs mereEksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl
Eksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 20-02-2018 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereMPH specialmodul Epidemiologi og Biostatistik
MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:
Læs mereKursus i anvendt onkologisk statistik og forskningsmetodik Dag 2. Jon K. Bjerregaard
Kursus i anvendt onkologisk statistik og forskningsmetodik Dag 2 Jon K. Bjerregaard Dag 2 09.00 12.00 Opfriskning fra sidst Gennemgang af artikler Sammenligning af en eller flere grupper Overlevelsesanalyse
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs merePhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereNormalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Læs mereHypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j
Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!
Læs mereBenchmarking af kommunernes sagsbehandling antagelser, metode og resultater
Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold
Læs mereLog-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.
Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)
Læs mereLøsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereMikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1
Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering
Læs mere25. april Probability of Developing Coronary Heart Disease in 6 years. Women (Aged 35-70) 160 No Yes
25. april 2. gang: Introduktion til Logistisk Regression Morten Frydenberg 22 Institut for Biostatistik, Århus Universitet MPH. studieår specialmodul Cand. San. uddannelsen. studieår Hvorfor logistisk
Læs mereHvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereEpidemiologi og Biostatistik. Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002
Epidemiologi og Biostatistik Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002 1 Statestik Det hedder det ikke! Statistik 2 Streptomycin til behandling af lunge-tuberkulose?
Læs mereKapitel 7 Forskelle mellem centraltendenser
Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens
Læs mereEks. 1: Kontinuert variabel som i princippet kan måles med uendelig præcision. tid, vægt,
Statistik noter Indhold Datatyper... 2 Middelværdi og standardafvigelse... 2 Normalfordelingen og en stikprøve... 2 prædiktionsinteval... 3 Beregne andel mellem 2 værdier, eller over og unden en værdi
Læs mereEksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet
Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,
Læs mereLogistisk Regression - fortsat
Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative
Læs mereRegneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)
Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereEstimation og konfidensintervaller
Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,
Læs mereTrin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereVelkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen
1 Velkommen til kurset Teoretisk Statistik Lærer: Niels-Erik Jensen Plan for i dag: 1. Eks: Er euro'en skæv? 4. Praktiske informationer 2. Eks: Regressionsmodel (kap. 1) 5. Lidt om kursets indhold 3. Hvad
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereEpidemiologi og Biostatistik Opgaver i Biostatistik Uge 7: 23. marts
Århus 19. marts 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 7: 23. marts Epibasic er nu opdateret til version 2.04 med arkene Str any og weighted Alle tabeller og tegninger
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mereProgram. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)
Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse
Læs mereHypotesetests, fejltyper og p-værdier
Hypotesetests, fejltyper og p-værdier Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 25, 2018 Søren Højsgaard Institut for Matematiske Fag, Aalborg Hypotesetests, Universitet
Læs mereSusanne Ditlevsen Institut for Matematiske Fag susanne
Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller
Læs mereKapitel 11 Lineær regression
Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereHver anden vil benytte øget åbningstid i dagtilbud
Børnefamiliers dagtilbud og arbejdsliv 17. maj 18 Hver anden vil benytte øget åbningstid i dagtilbud Halvdelen af alle lønmodtagere med børn mellem -13 år ville benytte sig af udvidede åbningstider i deres
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mere