Epidemiologi og Biostatistik
|
|
|
- Mette Kjærgaard
- 9 år siden
- Visninger:
Transkript
1 Epidemiologi og Biostatistik Kliniske målinger (Kapitel ) Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag (forelæsning) intra- og interindividuel inden for person f.eks. dag-til-dag mellem personer Korrelation 1 Hvad influerer på en (klinisk) måling? Metode-relateret: Individ-relateret: målemetode person apparat helbredstilstand kalibrering af apparat tidspunkt (sæson, døgn) observatør??? hospital??? skilder Klinisk måling: vi forestiller os, at der er en underliggende/ukendt sand værdi, som vi forsøger at måle (for en given person, med en given helbredstilstand, til et givet tidspunkt etc) Ved gentagen måling med samme metode: en lidt anden værdi (som regel), fordi: metoden har en indbygget usikkerhed (tilfældig fejl) F.eks. normalfordeling!!! En perfekt metodes måleresultat er: nøjagtig sand værdi + en meget lille tilfældig fejl En upræcis metodes måleresultat er: sand værdi + en stor tilfældig fejl Hvis kalibreringen er unøjagtig bliver metodens måleresultat: sand værdi + systematisk fejl + en tilfældig fejl unøjagtig upræcis præcis En god metodes måleresultat er: sand værdi + meget lille systematisk fejl + meget lille tilfældig fejl Ved gentagen måling med en anden metode: en lidt anden værdi (som regel), fordi: forskellige systematiske fejl forskellige tilfældige fejl nøjagtig præcis
2 Mange målemetoder vil ud fra metodens underliggende fysiske og/eller kemiske principper være gode (nøjagtige og præcise) lungefunktion: måling af rumfang kemiske analyse: kromatografisk metode Måling på noget biologisk introducerer en række nye og måske ukendte skilder, f.eks. : fastende i hvile intra instruktion af patienten før målingen patienterne er forskellige inter 7 Variansanalyse prøver at kvantificere systematiske og tilfældige kilder til eksempler: målinger på samme individ med samme metode forskellige målemetoder på samme individ observatører (patologer), samme individ/præparat 8 målinger per person, samme metode: f.eks. een af disse situationer: uge1/uge morgen/aften før/efter behandling tilfældig? altid målefejl over tid: altid intra-individuel Se-cholesterol PEFR blodtryk systematisk forskel? Nej Ja, Astma Ja, Beta-blokker altid interindividuel PEFR (l/min) målt med Wright meter Person 1. måling. måling : : : Data fra Table 1.1 (s. 7) Antag:ingen preference mellem de målinger, f.eks. målt forskellige dage Ingen systematisk forskel mellem de målinger tilfældig : interindividuel intraindividuel målefejl Variation mellem de målinger inden for person: intraindividuel + målefejl Dette design kan ikke adskille intraindividuel og målefejl Antag: for en given person kan de målinger beskrives ved den samme normalfordeling F.eks. stor dag-tildag eller stor målefejl? For hver person beregnes gennemsnit og spredning (s) Personens underliggende/- sande niveau Personens intraindividuelle PEFR (l/min) målt med Wright meter Person 1. måling. måling gns s : : : : : Tættere på den sande værdi s = spredning se = s for hver person (+ målefejl) 11 1
3 spredning Afhænger intraindividuel af personniveau?.... gennemsnit (gns) vs spredning (s) gennemsnit Forløb OK, ingen trend Bemærk: spredningen (s) er usikkert bestemt! 1 PEFR (l/min) målt med Wright meter Person 1. måling. måling gns s : : : : : fælles spredning s w = 1. w = within (mellem de målinger) Variation mellem personer 1 Variation mellem personer? Variation mellem personernes sande/underliggende niveauer De sande/underliggende niveauer er ukendte! Niveauet estimeres ved personens gennemsnit Usikkerhed på gennemsnittet: se (standard error = s w ) Derfor: hvis en mellem personer alene baseres på gennemsnittenes vil den også indeholde usikkerheden på gennemsnittet (se) og dermed en rest af s w Intraindividuel + måleusikkerhed 1 Den totale Glem strukturen i data og opfat de 17 x = observationer som een stikprøve. Det totale gennemsnit er gennemsnit af alle målinger = 7. l/min Den totale er en (spredningen) beregnet ud fra alle målinger: s Total ( xi x) 81. = = = 11. n 1 Den totale = inter- + intra-individuelle + målefejl 1 Table 1. (s. 7) fra bogen (variansanalyse-tabel) Intra-individuel + målefejl (within) Analysis of variance by subject for PEFR Source of Degrees of freedom Sum of squares Mean square Variance ratio (F) Between subjects Residual (within subjects) Total 81. s =. = 1. Prediktionsinterval for forskel mellem målinger på samme person forskellige dage: Bemærk, subject 1 ± 1. sw + sw = ±.77 sw = ±. falder udenfor w 17 Table 1., fortsat Inter-individuel (between) Analysis of variance by subject for PEFR Source of Degrees of freedom Sum of squares Mean square Variance ratio (F) Between subjects Residual (within subjects) Total 81. ( 7..) σ ˆ = = 11. b målinger pr individ Størrelsen af skilderne er næsten altid ordnet: Inter-individuel > intra-individuel (> målefejl) 18
4 Variansanalysetabellen kan bruges til at besvare spørgsmål som: Nyt forsøg: een måling pr individ. Hvilken vil vi forvente? Kombiner Between og Within erne: s Een måling ˆb sw 11. = σ + = Denne svarer altså til den vi vil forvente mellem de 17 personer, hvis vi kun har een måling pr individ (f.eks. den første). 1 målemetoder: Sammenligning under forskellige omstændigheder: standardiseret/kontrolleret prøve raske personer patienter Systematisk forskel: generelt niveau Eksempler på metodeforskelle: kun ved små/store værdier Slipper for: inter- og intraind. var. Tilfældig : større ved store værdier forskellige målefejl PEFR målt med Wright og Mini meter Person Wright (W) Mini (M) AVGWM (W+M)/ DIFWM (W-M) : : : : : Table 1. (s. 7) Mini 7 PEFR: metoder på 17 individer Person 1 Person 1 Wright 1 Perfekt overensstemmelse (Metoder ens) 7 1 Lineær regression? Mini (y) mod Wright (x)? Tolkning 1: Forklare (noget af) en i Mini (y) vha en i Wright (x)??? Tolkning : Prediktere Mini (y) vha Wright (x)??? Det kan være OK, hvis f.eks. Mini er en gold standard, der er dyr/besværlig at lave, og Wright er ny og simpel/billig metode Egenskaber ved gennemsnit og differens af de metoder: Hvis begge metoder formodes at være nogenlunde lige gode: gennemsnit tættere på sandheden differens variere symmetrisk omkring (ingen systematisk uoverensstemmelse) differens mellem de metoder tilfældig (den tilfældige uoverensstemmelse)
5 DIFWM Bland-Altman plot, PEFR: Mini vs Wright DIFWM forløber parallelt med x- akse DIF Bland-Altman plot, nyt eksempel DIF stigende tendens - - Person 1 Person 1 7 AVGWM DIFWM s konstant AVG Den systematiske forskel afhænger af niveau Bland-Altman plot, nyt eksempel PEFR: Mini vs Wright, fortsat Hypotese: ingen systematisk forskel DIF DIF s ikke konstant t-test:.1 t = = DF = 1, p =.8 - CI (%) : ( -.; 17.8) Forudsat, differenser normalfordelt 1 Std. Dev = Mean = N = AVG DIFWM (Wright - Mini) Den tilfældige afhænger af niveau 7 8 Limits of agreement = Prediktionsinterval for forskel mellem de metoder (værdier målt med de metoder på samme person) PI( % ) = DIFWM ± 1. sd =. 1± = 78.1; 7. Jvf. prediktionsinterval for forskel mellem målinger med Wright = -.;. Jern i knoglemarv (Nanna M. Jensen, Randers Centralsygehus) To observatører har (uafhængigt af hinanden) bedømt indholdet af jern i den samme prøve af knoglemarv fra ialt 7 patienter med jernmangel (bedømt ud fra blodprøve) Observatør patient 1 1 Intet Intet Intet Nedsat Normalt Normalt Nedsat Normalt Nedsat Intet : : :
6 Observatør Observatør 1 Intet Nedsat Normalt Øget Total Intet Nedsat 1 1 Normalt 1 Øget 1 Total Antal 1 Intet O 1 Nedsat Normalt Øget Intet Nedsat Normalt Øget Intet Normalt O 1 Observatør Observatør 1 Intet Nedsat Normalt Øget Total Intet Nedsat 1 1 Normalt 1 Øget 1 Total Er der systematisk uenighed mellem de observatører? O 1 - O Antal Sum Enige O1 = O +1 O1 = O -1 Antager at forskel mellem Intet og Nedsat svarer til forskel mellem Nedsat og Normalt etc Nulhypotese: Er der symmetri omkring? Men: data ikke normalfordelt??? Signed Wilcoxon test, Forelæsning! Korrelation Mål for afhængigheden (associationen) mellem variable. I regression er der preference mellem de variable: en responsvariabel og en forklarende variabel BMI og Kolesterol (fra Uge, regression): Næppe prediktere kolesterol vha BMI eller omvendt? interessant Se-total kolesterol (mmol/l) Er der en stigende tendens? Association mellem BMI og Kolesterol: en underliggende fælles årsag, f.eks. gener, livsstil, m.v. BMI
7 Begrebet korrelation har i statistisk forstand en præcis (sandsynlighedsteoretisk) definition. Korrelationskoefficienten ( ρ) er et tal mellem -1 og 1. Den måler den lineære afhængighed mellem variable (x og y). Hvis ρ = ±1 så ligger x og y præcist på en ret linie, dvs y = α + β x og ingen tilfældig 1, så er β Hvis ρ = + > 1, så er β < Hvis både x og y er kvantitative variable, kan korrelationskoefficienten estimeres ved Pearsons korrelationskoefficient (se Kap 11.). Den betegnes normalt r. Tolkning af denne koefficient (r) giver anledning til mange misforståelser. F.eks.: der er en god overensstemmelse mellem x og y, hvis r er tæt ved +1 eller -1 der er ingen sammenhæng mellem x og y, hvis r er tæt ved I praksis ligger observationerne aldrig på en ret linie! Se f.eks. bogen, s. 7, spørgsmål 7 og Se-total kolesterol (mmol/l) Ombytning af x-og y- BMI r =. (Pearson) p=. Hypotesen: ρ = (ingen association) kan testes vha Pearsons korrelations-koefficient, men det kræver en række forudsætninger opfyldt. Både x og y normalfordelt og linearitet se og sikkerhedsinterval kan udregnes! men I slipper! Kap. 11., 18. Hvis den ene (eller begge) variabel er en kategorisk variabel med ordnede kategorier (f.eks. NYHA I, II, III og IV eller en smerte-score) kan man ikke beregne Pearsons korrelationskoefficient. Mere om det i Forelæsning. akse ændrer ikke r (og p) Den mest udbredte misforståelse! Sammenligning af metoder vha korrelation??? Hvis de metoder stemmer overens vil punkterne i x-y plottet ligge på en ret line, ergo korrelation = 1! Ja! Se-total kolesterol (mmol/l) R =.8 = r =. Altså, hvis korrelationen er tæt på 1 stemmer de metoder (næsten) overens! Nej! BMI 1 Altså: Coefficient of determination = r PAS PÅ: matematisk ækvivalens, men forskellig tolkning
8 + G FE DC BA R FE DC BA Eksempel. metoder til måling af Højde (cm). Stemmer method 1 og mere overens end method og? NEJ! "!# $%&' Klar systematisk forskel Perfekt overensstemmelse ) * (,!# $%&,- Eksempel. metoder til måling af Højde (cm). Stemmer method 1 og mere overens end method og? NEJ! 8@ 78: 7 7 Q@ ; <= >? ; ; OP= > ; / ( / H"IJ KLM 8. /. 1 (. (. N H"IJ KLM,S 78: / Stor tilfældig forskel Variation i forskellen mellem de metoder Lille tilfældig forskel Ingen systematisk forskel Laves lineær regression i de eksempler fås i begge tilfælde Skrives gange R =. =.81, hhv R =.8 =. Men dette siger intet om hvor de regressionslinier ligger i forhold til identitetslinien ( α =, β = 1) 1.. Vi har lært: Korrelation måler ikke størrelsen af: 1. den systematiske forskel. den tilfældige forskel HUSK DET NU!
Epidemiologi og Biostatistik
Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag
Korrelation Pearson korrelationen
-9- Eidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Korrelation Kliniske målinger - Kliniske målinger og variationskilder - Estimation af størrelsen
Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april
Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et
12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Forelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Epidemiologi og Biostatistik. Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002
Epidemiologi og Biostatistik Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002 1 Statestik Det hedder det ikke! Statistik 2 Streptomycin til behandling af lunge-tuberkulose?
MPH specialmodul Epidemiologi og Biostatistik
MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:
Multipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Lineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se
Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller
Besvarelse af vitcap -opgaven
Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.
OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model
Epidemiologi og biostatistik. Uge 5, torsdag. marts 1 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Det statistiske
men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)
Institut for Folkesundhed Afdeling for Biostatistik Afdeling for Epidemiologi. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Udgangspunktet for de følgende spørgsmål er artiklen:
Anvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere
Epidemiologi og biostatistik. Uge 5, torsdag 5. september 003 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver
Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model
Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ
24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion
. februar 00 Ikke parametrisk statistiske test : Ideen bag Epidemiologi og biostatistik. Uge, mandag. februar 00 Morten Frydenberg, Institut for Biostatistik. To grupper: Mann-Whitney / Wilcoxon testet
Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik.
Epidemiologi og biostatistik. Uge, tirsdag. Erik Parner, Institut for Biostatistik. Generelt om statistik Dataanalysen - Deskriptiv statistik - Statistisk inferens Sammenligning af to grupper med kontinuerte
Anvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Modul 11: Simpel lineær regression
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................
Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Normalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)
Institut for Epidemiologi og Socialmedicin Institut for Biostatistik. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Læs afsnit.1 i An Introduction to Medical Statistics, specielt
Statistik Lektion 4. Variansanalyse Modelkontrol
Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede
Module 4: Ensidig variansanalyse
Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration
Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: [email protected] Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion
Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved
Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,
Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Reeksamen i Statistik for Biokemikere 6. april 2009
Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på
grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Modul 12: Regression og korrelation
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................
Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: [email protected] I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Kapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan
Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Løsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge
Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges
Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.
1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;
Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.
Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem
Økonometri Lektion 1 Simpel Lineær Regression 1/31
Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen
Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.
Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller
Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data
Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: [email protected] Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration
3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6
Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået
Kapitel 11 Lineær regression
Kapitel 11 Lineær regression Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),
Kapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet
Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm
Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik [email protected] Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation
Løsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Ikke-parametriske tests
Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference
Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Morten Frydenberg 14. marts 2006
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen
1. februar Lungefunktions data fra tirsdags Gennemsnit l/min
Epidemiologi og biostatistik Uge, torsdag 3. februar 005 Morten Frydenberg, Afdeling for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (ud
To samhørende variable
To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen
Morten Frydenberg 26. april 2004
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.
Opgavebesvarelse, brain weight
Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12
Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
En Introduktion til SAS. Kapitel 5.
En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel
Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2
Økonometri 1 Den simple regressionsmodel 11. september 2006 Dagens program Den simple regressionsmodel SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) Motivation for gennemgangen af SLR Definition
Generelle lineære modeller
Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal
Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
To-sidet varians analyse
To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),
Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j
Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!
Lineære normale modeller (4) udkast
E6 efterår 1999 Notat 21 Jørgen Larsen 2. december 1999 Lineære normale modeller (4) udkast 4.5 Regressionsanalyse 4.5.1 Præsentation 1 Regressionsanalyse handler om at undersøge hvordan én målt størrelse
Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet
Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,
Regressionsanalyse i SAS
Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse
Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala
3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter
Løsninger til kapitel 14
Opgave 14.1 a) Linjetilpasningsplottet bliver: Løsninger til kapitel 14 Idet datapunkterne ligger tæt på og jævnt fordelt omkring den rette linje, så ser det ud til, at der med rimelighed er tale om en
