Er hesten halt? Diagnosticering og kvantificering af halthed vha. accelerationsdata
|
|
|
- Pia Lauritzen
- 8 år siden
- Visninger:
Transkript
1 Institut for Matematiske Fag Er hesten halt? Diagnosticering og kvantificering af halthed vha. accelerationsdata Helle Sørensen Mød MATH på KU, november 2015
2 Problemstilling og mål Problemer: Heste bliver halte, og det er vigtigt at opdage det tidligt Ved svag halthed: Forskellige dyrlæger er ofte uenige om hvorvidt hesten er halt, hvor slemt det er, og på hvilket ben En dyrlæge er også ofte uenig med sig selv... Dias 2/32
3 Problemstilling og mål Problemer: Heste bliver halte, og det er vigtigt at opdage det tidligt Ved svag halthed: Forskellige dyrlæger er ofte uenige om hvorvidt hesten er halt, hvor slemt det er, og på hvilket ben En dyrlæge er også ofte uenig med sig selv... Ønske: Objektiv, personuafhængig metode der kan bruges til som supplement til sædvanlige undersøgelser. Metoden skal være nem at bruge på stedet Dias 2/32
4 Halthed og accelerationer Ide: En halt hest vil forsøge at mindske trykket den kraft hesten træder med når det halte ben er i jorden Kraft og acceleration er relaterede: F = m a Accelerationer kan nemt måles når hesten løber Kan vi bruge accelerationsdata til at diagnosticere og kvantificere halthed? Data indsamlet af Maj Halling Thomsen m.fl. fra KU. Analyser mm. lavet i samarbejde med min kollega Anders Tolver. Dias 3/32
5 Er hesten halt the movie Dias 4/32
6 3D accelerationssignaler Vertical direction Acceleration Transversal direction Acceleration Longitudinal direction Acceleration Time (gait cycles) Dias 5/32
7 Acceleration i lodret retning for en rask hest Normal Acceleration Time (gait cycles) Lodret acceleration for en rask hest i trav Stor acceleration stort tryk på overfladen Otte fuldt skridtcykler 6 sekunder 1500 datapunkter Tid 0 lige før landing på højre-forben/venstre-bagben Dias 6/32
8 Ser signalet anderledes ud for halte heste? Normal Acceleration Time (gait cycles) Dias 7/32
9 Ser signalet anderledes ud for halte heste? Normal Acceleration Time (gait cycles) Left fore Acceleration Time (gait cycles) Dias 7/32
10 Plan Formål: Diagnosticering og kvantificering af halthed vha. accelerationsmålinger. Fra observerede data til gennemsnitscyklus (præ-processering) Diagnosticering vha. en regressionsmodel Kvantificering vha. symmetriscorer Hvis der er tid til sidst: Lidt om regression i gymnasiet... Dias 8/32
11 Fra observerede data til gennemsnitscyklus Dias 9/32
12 Funktionelle data Præ-processering: Har: Accelerationer fra otte skridtcyklusser, y j til tid t j Ønskes: Estimat for en gennemsnitlig cyklus, ˆx(t), t (0, 1) Dias 10/32
13 Funktionelle data Præ-processering: Har: Accelerationer fra otte skridtcyklusser, y j til tid t j Ønskes: Estimat for en gennemsnitlig cyklus, ˆx(t), t (0, 1) Udfordringer: Har diskrete observationer, men ønsker en funktion Den sande funktion er glat, men data er observeret med støj/fejl: y j = x(t j ) + ε j Kan være forskel i timing fra cyklus til cyklus så et simpelt gennemsnit kan være misvisende Dias 10/32
14 Funktionelle data Præ-processering: Har: Accelerationer fra otte skridtcyklusser, y j til tid t j Ønskes: Estimat for en gennemsnitlig cyklus, ˆx(t), t (0, 1) Udfordringer: Har diskrete observationer, men ønsker en funktion Den sande funktion er glat, men data er observeret med støj/fejl: y j = x(t j ) + ε j Kan være forskel i timing fra cyklus til cyklus så et simpelt gennemsnit kan være misvisende Teknikker: Udglatning, alignment. Stammer fra del af statistikken der kaldes funktionel dataanalyse (FDA). Dias 10/32
15 Præ-processering Raw data and zero crossings Acceleration Time Before alignment After alignment Shift to cosine Acceleration Time Time Time Dias 11/32
16 Estimeret gennemsnitssignal Et signal består af to halvdele svarende til de to diagonaler. Første halvdel svarer til at hesten står på højre forben og venstre bagben. Nonlame Left fore limb Vertical acceleration Vertical acceleration Time Time Dias 12/32
17 85 gennemsnitssignaler Acceleration LF RF NO Acceleration LH RH LF LH NO RF RH Time Time Time Dias 13/32
18 Diagnosticering vha. en regressionsmodel Dias 14/32
19 Regression Data og formål med regression: Data: (x 1,y 1 ),...,(x n,y n ) Interesseret i hvordan x i påvirker fordelingen af Y i Dias 15/32
20 Regression Data og formål med regression: Data: (x 1,y 1 ),...,(x n,y n ) Interesseret i hvordan x i påvirker fordelingen af Y i Sædvanlige situationer: Alm. lineær regression: x i,y i R og vi antager EY i = α +β x i Logistisk regression: x i R, y i {0,1} og vi antager at eα+β x i 1 P(Y i = 1) = 1 + e α+β x, P(Y i = 0) = i 1 + e α+β x i Dias 15/32
21 Regression Data og formål med regression: Data: (x 1,y 1 ),...,(x n,y n ) Interesseret i hvordan x i påvirker fordelingen af Y i Sædvanlige situationer: Alm. lineær regression: x i,y i R og vi antager EY i = α +β x i Logistisk regression: x i R, y i {0,1} og vi antager at eα+β x i 1 P(Y i = 1) = 1 + e α+β x, P(Y i = 0) = i 1 + e α+β x i I vores situation er x i en funktion (gennemsnitssignalet) og y i kan antage fem ikke-ordnede værdier (NO, LF, LH, RF, RH). Dias 15/32
22 Funktionel multinomial regression I vores situation er x i en funktion (gennemsnitssignalet) og y i kan antage fem ikke-ordnede værdier (NO, LF, LH, RF, RH). Antagelse om sammenhæng mellem signal og halthedsgruppe: P(Y i = g) = eη g 1 h e η, hvor η g = α g + β g (t) x i (t)dt h 0 Dette antages for alle g {NO,LF,LH,RF,RH} Dias 16/32
23 Funktionel multinomial regression I vores situation er x i en funktion (gennemsnitssignalet) og y i kan antage fem ikke-ordnede værdier (NO, LF, LH, RF, RH). Antagelse om sammenhæng mellem signal og halthedsgruppe: P(Y i = g) = eη g 1 h e η, hvor η g = α g + β g (t) x i (t)dt h 0 Dette antages for alle g {NO,LF,LH,RF,RH} Bemærk: Et sæt af ukendte parametre for hver gruppe: α g og β g α g R, men β g er en funktion, β g : (0,1) R Normering sikrer at sandsynlighederne summerer til 1 Dias 16/32
24 Estimation Bestem de værdier α g og de funktioner β g der får modellen til at passe bedst muligt med data. Alle g samtidig. Dette er vanskeligt! Vores løsning baserer sig på basisudviklinger af både x i erne og β g erne Kan vi forstå formen af β g erne? Kan vi genkende noget symmetri i estimaterne? Mest interessant at se på forskelle til NO, dvs. ˆβ g ˆβ NO. Dias 17/32
25 Estimerede koefficientfunktioner ˆβ g ˆβ NO Left fore normal Right fore normal Difference in betahat Difference in betahat Time Left hind normal Time Right hind normal Difference in betahat Difference in betahat Time Time Dias 18/32
26 Klassifikation (prædiktion) Har altså estimater, ˆα g og ˆβ g, og dermed en estimeret model: e ˆη g ˆP(Y = g x) = h e ˆη h 1, hvor ˆη g = ˆα g + ˆβ g (t) x(t)dt 0 Dias 19/32
27 Klassifikation (prædiktion) Har altså estimater, ˆα g og ˆβ g, og dermed en estimeret model: e ˆη g ˆP(Y = g x) = h e ˆη h 1, hvor ˆη g = ˆα g + ˆβ g (t) x(t)dt 0 Klassifikationsproblem: Ny acc.-måling, x 0 : (0,1) R. Hvad er hestens haltstatus? Beregn P(Y = g x 0 ) for alle fem halthedsgrupper Vælg den gruppe med den største sandsynlighed Hvor god er denne klassifikationsmetode? Dias 19/32
28 Klassifikationsresultater Leave-one-out studie: For hvert af de 85 signaler: Estimer parametrene vha. alle de andre data Brug estimaterne til at prædiktere gruppen for signalet Dias 20/32
29 Klassifikationsresultater Leave-one-out studie: For hvert af de 85 signaler: Estimer parametrene vha. alle de andre data Brug estimaterne til at prædiktere gruppen for signalet Prædikteret gruppe Sand gruppe LF LH NO RF RH LF LH NO RF RH signaler klassificeret til korrekt gruppe, (80%); fem signaler mere til korrekt diagonal; kun et signal til forkert diagonal. Dias 20/32
30 Den største sandsynlighed ifm. klassifikation Correct group Correct diagonal, wrong group Remaining True status LF LH NO RF RH Maximum probability Dias 21/32
31 Kvantificering af halthed vha. symmetriscorer Dias 22/32
32 Symmetriscore A Nonlame Left fore limb Vertical acceleration Vertical acceleration Time Time Forslag til symmetriscore: log-forskel mellem rødt og blåt areal, ( rødt areal ) A = log blåt areal Vi forventer at A 0 for raske heste, men ikke for halte heste. Dias 23/32
33 K Ø B E N H A V N S U N I V E R S I T E T Opfører A sig som forventet? RH RF no LH LF A score Data fra 72 heste: Samme grupper som før Halthed i to grader: mild ( ), moderat ( ) Dias 24/32
34 K Ø B E N H A V N S U N I V E R S I T E T Opfører A sig som forventet? RH RF no LH LF A score Data fra 72 heste: Samme grupper som før Halthed i to grader: mild ( ), moderat ( ) A varierer omkring 0 for raske heste, men ikke for halte heste A > 0 på LF/RH diagonal, og A < 0 på RF/LH diagonal Tendens: A større for moderat end for mild halthed Dias 24/32
35 Symmetriscore S Nonlame Left fore limb Vertical acceleration Vertical acceleration Time Time Forslag til symmetriscore: Log-transformeret, normeret L 2 -afstand, ( x1 (t) x 2 (t) ) 2 dt S = log ( x1 (t) + x 2 (t) ) 2 dt Vi forventer at S er mindre for raske end for halte heste. Dias 25/32
36 K Ø B E N H A V N S U N I V E R S I T E T Opfører S sig som forventet? RH RF no LH LF S score Data fra 72 heste: Samme grupper som før Halthed i to grader: mild ( ), moderat ( ) Dias 26/32
37 K Ø B E N H A V N S U N I V E R S I T E T Opfører S sig som forventet? RH RF no LH LF S score Data fra 72 heste: Samme grupper som før Halthed i to grader: mild ( ), moderat ( ) Stor variation mellem heste S mindre for raske end halte heste, især ved moderat halthed Kan ikke skelne mellem de to diagonaler (forventet) Dias 26/32
38 Hvad bruges symmetriscorerne til? Husk: Dyrlæger er ofte uenige med hinanden (og sig selv) om graden af halthed Ønskede objektive, person-uafhængige kvantitative mål for halthed (symmetri). S og A er netop sådanne mål! Scorerne bruges i forskningssammenhæng til at undersøge effekten af forskellige påvirkninger på hestes gangmønstre. Dias 27/32
39 Eksempel 1: Langdistanceridt ( km) A Finished Lameness Metabolic Lame/Met S Data indsamlet før og efter langdistanceridt (før efter) Bevægelse mod asymmetri, især heste der udgår pga. halthed Vil bruge målinger undervejs til at opdage problemer Dias 28/32
40 Eksempel 2: Smerter ifm. ledbetændelse Lameness score A Time after injection Induceret ledbetændelse i knæleddet på højre forben hhv. venstre forben til tid 0 (efter måling). Målt indtil 168 timer. Kan bruges til at undersøge effekt af behandling (ikke vist) Dias 29/32
41 Konklusion mm. Har forhåbentlig overbevist jer om at accelerationssignaler indeholder information om hestens gangmønster kan bruges som redskab til diagnosticering og kvantificering af halthed, naturligvis som supplement til kliniske undersøgelser Dias 30/32
42 Konklusion mm. Har forhåbentlig overbevist jer om at accelerationssignaler indeholder information om hestens gangmønster kan bruges som redskab til diagnosticering og kvantificering af halthed, naturligvis som supplement til kliniske undersøgelser Matematikken/statistikken: Funktionel dataanalyse: Hver observation er en funktion Udglatning, alignment, funktionel regression, klassifikation Måske ikke helt egnet til gymnasieelever... Men jeg har en light version af foredraget til gymnasieklasser Dias 30/32
43 Regression i gymnasiet Dias 31/32
44 Ideer til regression i gymnasiet Til gengæld tror jeg man vil kunne lave gode forløb om regression i gymnasiet, også i samarbejde med andre fag. Brug/indsaml data! Dias 32/32
45 Ideer til regression i gymnasiet Til gengæld tror jeg man vil kunne lave gode forløb om regression i gymnasiet, også i samarbejde med andre fag. Brug/indsaml data! Mulige udvidelser af pensum om alm. lineær regression: Udledning af estimater for hældning og skæring (formler) Vil give forståelse for mindste kvadraters metode og kan gennemføres med alm. funktionsundersøgelse. Ikke-lineær regression, fx. med den logistiske funktion Kombinér med grundig undersøgelse af de valgte funktioner Eksponentiel regression og potensregression på original og log-transformeret skala (sammenligninger og validitet) Kvadratisk og/eller multipel regression (flere x er) Logistisk regression, altså situationen med 0/1 respons Dias 32/32
Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Anvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Logistisk regression
Logistisk regression Anvendt statistik Anders Tolver Jensen Institut for Grundvidenskab og Miljø Onsdag d. 25/2-2009 ATJ (IGM KU-LIFE) Logistisk regression Anvendt statistik 25/2-2009 1 / 12 (Multinomial)
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Forelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Anvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Økonometri: Lektion 2 Multipel Lineær Regression 1/27
Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere
Lineær regression: lidt mere tekniske betragtninger om R 2 og et godt alternativ
Lineær regression: lidt mere tekniske betragtninger om R 2 og et godt alternativ Per Bruun Brockhoff, DTU Compute, Claus Thorn Ekstrøm, KU Biostatistik, Ernst Hansen, KU Matematik January 17, 2017 Abstract
men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Statistisk modellering og regressionsanalyse
Statistisk modellering og regressionsanalyse Claus Thorn Ekstrøm KU Biostatistik [email protected] Oktober 25, 2018 Slides @ biostatistics.dk/talks/ 1 2 Hvad er statistik? Statistics is a science, not
Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).
Program 1. multipel regression 2. polynomiel regression (og andre kurver) 3. kategoriske variable 4. Determinationkoefficient og justeret determinationskoefficient 5. ANOVA-tabel 1/13 Multipel regression
Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen
1 Velkommen til kurset Teoretisk Statistik Lærer: Niels-Erik Jensen Plan for i dag: 1. Eks: Er euro'en skæv? 4. Praktiske informationer 2. Eks: Regressionsmodel (kap. 1) 5. Lidt om kursets indhold 3. Hvad
Kapitel 11 Lineær regression
Kapitel 11 Lineær regression Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),
Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
Module 4: Ensidig variansanalyse
Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2
Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Simpel Lineær Regression: Model
Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]
Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Perspektiver i Matematik-Økonomi: Linær regression
Perspektiver i Matematik-Økonomi: Linær regression Jens Ledet Jensen H2.21, email: [email protected] Perspektiver i Matematik-Økonomi: Linær regression p. 1/34 Program for i dag 1. Indledning: sammenhæng mellem
Kvadratisk regression
Kvadratisk regression Helle Sørensen Institut for Matematiske Fag Københavns Universitet Juli 2011 I kapitlet om lineær regression blev det vist hvordan man kan modellere en lineær sammenhæng mellem to
Økonometri: Lektion 2 Multipel Lineær Regression 1/33
Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 +β 1 x +u, hvor fejlledet u,
Statistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: [email protected] I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Statistik Lektion 4. Variansanalyse Modelkontrol
Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede
Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl
Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - [email protected] Institut for Matematiske Fag Aalborg Universitet 1/36 Estimation af varians/spredning Antag X 1,...,X n stokastiske
Multipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.
Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem
Dynamisk statistisk modellering af vedligeholdelsesbehandling af børn med akut lymfoblastær leukæmi
Dynamisk statistisk modellering af vedligeholdelsesbehandling af børn med akut lymfoblastær leukæmi Susanne Rosthøj 2. oktober 2009 Akut Lymfoblastær Leukæmi (ALL) Årlig forekomst på ca 35 tilfælde i Danmark.
Økonometri Lektion 1 Simpel Lineær Regression 1/31
Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen
Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Logistisk regression
Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller
Reeksamen i Statistik for Biokemikere 6. april 2009
Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på
Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april
Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et
Dansk Erhvervs gymnasieanalyse Sådan gør vi
METODENOTAT Dansk Erhvervs gymnasieanalyse Sådan gør vi FORMÅL Formålet med analysen er at undersøge, hvor dygtige de enkelte gymnasier er til at løfte elevernes faglige niveau. Dette kan man ikke undersøge
Lineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger
Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: [email protected] I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt
Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006
Dagens program Økonometri Den multiple regressionsmodel 8. september 006 Opsamling af statistiske resultater om den simple lineære regressionsmodel (W kap..5). Den multiple lineære regressionsmodel (W
Introduktion til GLIMMIX
Introduktion til GLIMMIX Af Jens Dick-Nielsen [email protected] 21.08.2008 Proc GLIMMIX GLIMMIX kan bruges til modeller, hvor de enkelte observationer ikke nødvendigvis er uafhængige.
Lineær og logistisk regression
Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Dagens program Lineær regression
Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved
Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,
Tema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.
Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data. 1 / 32 Motivation Eksempel: Savings = β 0 + β 1 Income + u Vi ved allerede, hvordan vi estimerer regresseionlinjen:
Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Forelæsning 3: Kapitel 5: Kontinuerte fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Lineær regression i SAS. Lineær regression i SAS p.1/20
Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression
Epidemiologi og Biostatistik
Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag
Simpel Lineær Regression
Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige
Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion
Økonometri lektion 5 Multipel Lineær Regression Inferens Modelkontrol Prædiktion Multipel Lineær Regression Data: Sæt af oservationer (x i, x i,, x ki, y i, i,,n y i er den afhængige variael x i, x i,,
Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6
Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået
Hvad skal vi lave? Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning. 1 Kovariansanalyse. 2 Sammenligning af modeller
Hvad skal vi lave? 1 Kovariansanalyse Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning 2 Sammenligning af modeller 3 Mere generelle modeller PSE (I17) ASTA - 14. lektion
MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Morten Frydenberg Biostatistik version dato:
Tye og Tye 2 fejl Statistisk styrke Biostatistik uge 2 mandag Morten Frydenberg, Afdeling for Biostatistik Styrkeovervejelser i lanlægning af et studie Logistisk regression Præterm fødsel, rygning, alder,
Statistik i basketball
En note til opgaveskrivning [email protected] 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større
OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere
Epidemiologi og biostatistik. Uge 5, torsdag 5. september 003 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver
Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n.
Simple fejlforplantningslov Landmålingens fejlteori Lektion 6 Den generelle fejlforplantningslov Antag X, X,, X n er n uafhængige stokastiske variable, hvor Var(X )σ,, Var(X n )σ n Lad Y g(x, X,, X n ),
Modul 6: Regression og kalibrering
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 6: Regression og kalibrering 6.1 Årsag og virkning................................... 1 6.2 Kovarians og korrelation...............................
Note om Monte Carlo metoden
Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at
Ting man gør med Vektorfunktioner
Ting man gør med Vektorfunktioner Frank Nasser. april 11 c 8-11. Dette dokument må kun anvendes til undervisning i klasser som abonnerer på MatBog.dk. Se yderligere betingelser for brug her. Bemærk: Dette
Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher
Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: [email protected]
Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S
Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed
Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.
1 Levetidsanalyse Overlevelsesfunktionen Censurering Kaplan-Meier estimatoren Hazard funktionen Proportionale hazards Multipel regression PSE (I17) FSV1 Statistik - 5. lektion 1 / 19 Overlevelsesfunktionen
Eksamen i Statistik for biokemikere. Blok
Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)
Rygtespredning: Et logistisk eksperiment
Rygtespredning: Et logistisk eksperiment For at det nu ikke skal ende i en omgang teoretisk tørsvømning er det vist på tide vi kigger på et konkret logistisk eksperiment. Der er selvfølgelig flere muligheder,
Kvantitative metoder 2
Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007 regressionsmodel 1 Dagens program Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5, E.2) Variansen
Lineære normale modeller (4) udkast
E6 efterår 1999 Notat 21 Jørgen Larsen 2. december 1999 Lineære normale modeller (4) udkast 4.5 Regressionsanalyse 4.5.1 Præsentation 1 Regressionsanalyse handler om at undersøge hvordan én målt størrelse
Center for Statistik. Multipel regression med laggede responser som forklarende variable
Center for Statistik Handelshøjskolen i København MPAS Tue Tjur November 2006 Multipel regression med laggede responser som forklarende variable Ved en tidsrække forstås i almindelighed et datasæt, der
To samhørende variable
To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen
Modul 12: Regression og korrelation
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................
Susanne Ditlevsen Institut for Matematiske Fag Email: [email protected] http://math.ku.dk/ susanne
Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: [email protected] http://math.ku.dk/ susanne 5. undervisningsuge, onsdag
