Er hesten halt? Diagnosticering og kvantificering af halthed vha. accelerationsdata

Relaterede dokumenter
1 Regressionsproblemet 2

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Logistisk regression

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Forelæsning 11: Kapitel 11: Regressionsanalyse

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Lineær regression: lidt mere tekniske betragtninger om R 2 og et godt alternativ

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Statistisk modellering og regressionsanalyse

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Kapitel 11 Lineær regression

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Module 4: Ensidig variansanalyse

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Simpel Lineær Regression: Model

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Perspektiver i Matematik-Økonomi: Linær regression

Kvadratisk regression

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Statistik II 4. Lektion. Logistisk regression

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Statistik Lektion 4. Variansanalyse Modelkontrol

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Multipel Lineær Regression

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Dynamisk statistisk modellering af vedligeholdelsesbehandling af børn med akut lymfoblastær leukæmi

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Kausale modeller. Konstruktion og analyse

Logistisk regression

Reeksamen i Statistik for Biokemikere 6. april 2009

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Dansk Erhvervs gymnasieeffekt - sådan gør vi

Dansk Erhvervs gymnasieanalyse Sådan gør vi

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Introduktion til GLIMMIX

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Lineær og logistisk regression

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Tema. Dagens tema: Indfør centrale statistiske begreber.

Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

ELISA. ELISA (enzyme-linked immunosorbent assay) forsøg bruges til at detektere og kvantificere stoffer såsom proteiner, peptider, antistoffer o.lig.

Lineær regression i SAS. Lineær regression i SAS p.1/20

Forsøgsplanlægning Stikprøvestørrelse

Epidemiologi og Biostatistik

Simpel Lineær Regression

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Hvad skal vi lave? Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning. 1 Kovariansanalyse. 2 Sammenligning af modeller

Den lineære normale model

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Morten Frydenberg Biostatistik version dato:

Statistik i basketball

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n.

Modul 6: Regression og kalibrering

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater

Note om Monte Carlo metoden

Ting man gør med Vektorfunktioner

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Eksamen i Statistik for biokemikere. Blok

Rygtespredning: Et logistisk eksperiment

Kvantitative metoder 2

Lineære normale modeller (4) udkast

Center for Statistik. Multipel regression med laggede responser som forklarende variable

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.

To samhørende variable

Modul 12: Regression og korrelation

Susanne Ditlevsen Institut for Matematiske Fag susanne

Transkript:

Institut for Matematiske Fag Er hesten halt? Diagnosticering og kvantificering af halthed vha. accelerationsdata Helle Sørensen Mød MATH på KU, november 2015

Problemstilling og mål Problemer: Heste bliver halte, og det er vigtigt at opdage det tidligt Ved svag halthed: Forskellige dyrlæger er ofte uenige om hvorvidt hesten er halt, hvor slemt det er, og på hvilket ben En dyrlæge er også ofte uenig med sig selv... Dias 2/32

Problemstilling og mål Problemer: Heste bliver halte, og det er vigtigt at opdage det tidligt Ved svag halthed: Forskellige dyrlæger er ofte uenige om hvorvidt hesten er halt, hvor slemt det er, og på hvilket ben En dyrlæge er også ofte uenig med sig selv... Ønske: Objektiv, personuafhængig metode der kan bruges til som supplement til sædvanlige undersøgelser. Metoden skal være nem at bruge på stedet Dias 2/32

Halthed og accelerationer Ide: En halt hest vil forsøge at mindske trykket den kraft hesten træder med når det halte ben er i jorden Kraft og acceleration er relaterede: F = m a Accelerationer kan nemt måles når hesten løber Kan vi bruge accelerationsdata til at diagnosticere og kvantificere halthed? Data indsamlet af Maj Halling Thomsen m.fl. fra KU. Analyser mm. lavet i samarbejde med min kollega Anders Tolver. Dias 3/32

Er hesten halt the movie Dias 4/32

3D accelerationssignaler Vertical direction Acceleration 1 0 1 2 0 2 4 6 8 Transversal direction Acceleration 1.0 0.0 1.0 0 2 4 6 8 Longitudinal direction Acceleration 2 0 2 4 0 2 4 6 8 Time (gait cycles) Dias 5/32

Acceleration i lodret retning for en rask hest Normal Acceleration 1.5 0.0 1.5 0 2 4 6 8 Time (gait cycles) Lodret acceleration for en rask hest i trav Stor acceleration stort tryk på overfladen Otte fuldt skridtcykler 6 sekunder 1500 datapunkter Tid 0 lige før landing på højre-forben/venstre-bagben Dias 6/32

Ser signalet anderledes ud for halte heste? Normal Acceleration 1.5 0.0 1.5 0 2 4 6 8 Time (gait cycles) Dias 7/32

Ser signalet anderledes ud for halte heste? Normal Acceleration 1.5 0.0 1.5 0 2 4 6 8 Time (gait cycles) Left fore Acceleration 1 0 1 2 0 2 4 6 8 Time (gait cycles) Dias 7/32

Plan Formål: Diagnosticering og kvantificering af halthed vha. accelerationsmålinger. Fra observerede data til gennemsnitscyklus (præ-processering) Diagnosticering vha. en regressionsmodel Kvantificering vha. symmetriscorer Hvis der er tid til sidst: Lidt om regression i gymnasiet... Dias 8/32

Fra observerede data til gennemsnitscyklus Dias 9/32

Funktionelle data Præ-processering: Har: Accelerationer fra otte skridtcyklusser, y j til tid t j Ønskes: Estimat for en gennemsnitlig cyklus, ˆx(t), t (0, 1) Dias 10/32

Funktionelle data Præ-processering: Har: Accelerationer fra otte skridtcyklusser, y j til tid t j Ønskes: Estimat for en gennemsnitlig cyklus, ˆx(t), t (0, 1) Udfordringer: Har diskrete observationer, men ønsker en funktion Den sande funktion er glat, men data er observeret med støj/fejl: y j = x(t j ) + ε j Kan være forskel i timing fra cyklus til cyklus så et simpelt gennemsnit kan være misvisende Dias 10/32

Funktionelle data Præ-processering: Har: Accelerationer fra otte skridtcyklusser, y j til tid t j Ønskes: Estimat for en gennemsnitlig cyklus, ˆx(t), t (0, 1) Udfordringer: Har diskrete observationer, men ønsker en funktion Den sande funktion er glat, men data er observeret med støj/fejl: y j = x(t j ) + ε j Kan være forskel i timing fra cyklus til cyklus så et simpelt gennemsnit kan være misvisende Teknikker: Udglatning, alignment. Stammer fra del af statistikken der kaldes funktionel dataanalyse (FDA). Dias 10/32

Præ-processering Raw data and zero crossings Acceleration 1.0 0.0 1.0 0 2 4 6 8 Time Before alignment After alignment Shift to cosine Acceleration 1.0 0.0 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Time 1.0 0.0 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Time 1.0 0.0 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Time Dias 11/32

Estimeret gennemsnitssignal Et signal består af to halvdele svarende til de to diagonaler. Første halvdel svarer til at hesten står på højre forben og venstre bagben. Nonlame Left fore limb Vertical acceleration 2 1 0 1 2 Vertical acceleration 2 1 0 1 2 0.0 0.2 0.4 0.6 0.8 1.0 Time 0.0 0.2 0.4 0.6 0.8 1.0 Time Dias 12/32

85 gennemsnitssignaler Acceleration 1 0 1 2 LF 1 0 1 2 RF 1 0 1 2 NO 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Acceleration 1 0 1 2 LH 1 0 1 2 RH 1 0 1 2 LF LH NO RF RH 0.0 0.2 0.4 0.6 0.8 1.0 Time 0.0 0.2 0.4 0.6 0.8 1.0 Time 0.0 0.2 0.4 0.6 0.8 1.0 Time Dias 13/32

Diagnosticering vha. en regressionsmodel Dias 14/32

Regression Data og formål med regression: Data: (x 1,y 1 ),...,(x n,y n ) Interesseret i hvordan x i påvirker fordelingen af Y i Dias 15/32

Regression Data og formål med regression: Data: (x 1,y 1 ),...,(x n,y n ) Interesseret i hvordan x i påvirker fordelingen af Y i Sædvanlige situationer: Alm. lineær regression: x i,y i R og vi antager EY i = α +β x i Logistisk regression: x i R, y i {0,1} og vi antager at eα+β x i 1 P(Y i = 1) = 1 + e α+β x, P(Y i = 0) = i 1 + e α+β x i Dias 15/32

Regression Data og formål med regression: Data: (x 1,y 1 ),...,(x n,y n ) Interesseret i hvordan x i påvirker fordelingen af Y i Sædvanlige situationer: Alm. lineær regression: x i,y i R og vi antager EY i = α +β x i Logistisk regression: x i R, y i {0,1} og vi antager at eα+β x i 1 P(Y i = 1) = 1 + e α+β x, P(Y i = 0) = i 1 + e α+β x i I vores situation er x i en funktion (gennemsnitssignalet) og y i kan antage fem ikke-ordnede værdier (NO, LF, LH, RF, RH). Dias 15/32

Funktionel multinomial regression I vores situation er x i en funktion (gennemsnitssignalet) og y i kan antage fem ikke-ordnede værdier (NO, LF, LH, RF, RH). Antagelse om sammenhæng mellem signal og halthedsgruppe: P(Y i = g) = eη g 1 h e η, hvor η g = α g + β g (t) x i (t)dt h 0 Dette antages for alle g {NO,LF,LH,RF,RH} Dias 16/32

Funktionel multinomial regression I vores situation er x i en funktion (gennemsnitssignalet) og y i kan antage fem ikke-ordnede værdier (NO, LF, LH, RF, RH). Antagelse om sammenhæng mellem signal og halthedsgruppe: P(Y i = g) = eη g 1 h e η, hvor η g = α g + β g (t) x i (t)dt h 0 Dette antages for alle g {NO,LF,LH,RF,RH} Bemærk: Et sæt af ukendte parametre for hver gruppe: α g og β g α g R, men β g er en funktion, β g : (0,1) R Normering sikrer at sandsynlighederne summerer til 1 Dias 16/32

Estimation Bestem de værdier α g og de funktioner β g der får modellen til at passe bedst muligt med data. Alle g samtidig. Dette er vanskeligt! Vores løsning baserer sig på basisudviklinger af både x i erne og β g erne Kan vi forstå formen af β g erne? Kan vi genkende noget symmetri i estimaterne? Mest interessant at se på forskelle til NO, dvs. ˆβ g ˆβ NO. Dias 17/32

Estimerede koefficientfunktioner ˆβ g ˆβ NO Left fore normal Right fore normal Difference in betahat 0.5 0.0 0.5 1.0 Difference in betahat 0.5 0.0 0.5 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Time Left hind normal 0.0 0.2 0.4 0.6 0.8 1.0 Time Right hind normal Difference in betahat 0.5 0.0 0.5 1.0 Difference in betahat 0.5 0.0 0.5 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Time 0.0 0.2 0.4 0.6 0.8 1.0 Time Dias 18/32

Klassifikation (prædiktion) Har altså estimater, ˆα g og ˆβ g, og dermed en estimeret model: e ˆη g ˆP(Y = g x) = h e ˆη h 1, hvor ˆη g = ˆα g + ˆβ g (t) x(t)dt 0 Dias 19/32

Klassifikation (prædiktion) Har altså estimater, ˆα g og ˆβ g, og dermed en estimeret model: e ˆη g ˆP(Y = g x) = h e ˆη h 1, hvor ˆη g = ˆα g + ˆβ g (t) x(t)dt 0 Klassifikationsproblem: Ny acc.-måling, x 0 : (0,1) R. Hvad er hestens haltstatus? Beregn P(Y = g x 0 ) for alle fem halthedsgrupper Vælg den gruppe med den største sandsynlighed Hvor god er denne klassifikationsmetode? Dias 19/32

Klassifikationsresultater Leave-one-out studie: For hvert af de 85 signaler: Estimer parametrene vha. alle de andre data Brug estimaterne til at prædiktere gruppen for signalet Dias 20/32

Klassifikationsresultater Leave-one-out studie: For hvert af de 85 signaler: Estimer parametrene vha. alle de andre data Brug estimaterne til at prædiktere gruppen for signalet Prædikteret gruppe Sand gruppe LF LH NO RF RH LF 13 0 2 0 1 LH 1 12 2 1 0 NO 1 1 19 1 1 RF 0 2 1 13 0 RH 1 0 2 0 11 68 signaler klassificeret til korrekt gruppe, (80%); fem signaler mere til korrekt diagonal; kun et signal til forkert diagonal. Dias 20/32

Den største sandsynlighed ifm. klassifikation Correct group Correct diagonal, wrong group Remaining True status LF LH NO RF RH 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 Maximum probability Dias 21/32

Kvantificering af halthed vha. symmetriscorer Dias 22/32

Symmetriscore A Nonlame Left fore limb Vertical acceleration 2 1 0 1 2 Vertical acceleration 2 1 0 1 2 0.0 0.2 0.4 0.6 0.8 1.0 Time 0.0 0.2 0.4 0.6 0.8 1.0 Time Forslag til symmetriscore: log-forskel mellem rødt og blåt areal, ( rødt areal ) A = log blåt areal Vi forventer at A 0 for raske heste, men ikke for halte heste. Dias 23/32

K Ø B E N H A V N S U N I V E R S I T E T Opfører A sig som forventet? RH RF no LH LF 1.5 1.0 0.5 0.0 0.5 A score Data fra 72 heste: Samme grupper som før Halthed i to grader: mild ( ), moderat ( ) Dias 24/32

K Ø B E N H A V N S U N I V E R S I T E T Opfører A sig som forventet? RH RF no LH LF 1.5 1.0 0.5 0.0 0.5 A score Data fra 72 heste: Samme grupper som før Halthed i to grader: mild ( ), moderat ( ) A varierer omkring 0 for raske heste, men ikke for halte heste A > 0 på LF/RH diagonal, og A < 0 på RF/LH diagonal Tendens: A større for moderat end for mild halthed Dias 24/32

Symmetriscore S Nonlame Left fore limb Vertical acceleration 2 1 0 1 2 Vertical acceleration 2 1 0 1 2 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Time Time Forslag til symmetriscore: Log-transformeret, normeret L 2 -afstand, ( x1 (t) x 2 (t) ) 2 dt S = log ( x1 (t) + x 2 (t) ) 2 dt Vi forventer at S er mindre for raske end for halte heste. Dias 25/32

K Ø B E N H A V N S U N I V E R S I T E T Opfører S sig som forventet? RH RF no LH LF 6 5 4 3 2 S score Data fra 72 heste: Samme grupper som før Halthed i to grader: mild ( ), moderat ( ) Dias 26/32

K Ø B E N H A V N S U N I V E R S I T E T Opfører S sig som forventet? RH RF no LH LF 6 5 4 3 2 S score Data fra 72 heste: Samme grupper som før Halthed i to grader: mild ( ), moderat ( ) Stor variation mellem heste S mindre for raske end halte heste, især ved moderat halthed Kan ikke skelne mellem de to diagonaler (forventet) Dias 26/32

Hvad bruges symmetriscorerne til? Husk: Dyrlæger er ofte uenige med hinanden (og sig selv) om graden af halthed Ønskede objektive, person-uafhængige kvantitative mål for halthed (symmetri). S og A er netop sådanne mål! Scorerne bruges i forskningssammenhæng til at undersøge effekten af forskellige påvirkninger på hestes gangmønstre. Dias 27/32

Eksempel 1: Langdistanceridt (120 160 km) A 0.3 0.1 0.1 0.3 Finished Lameness Metabolic Lame/Met 7 6 5 4 S Data indsamlet før og efter langdistanceridt (før efter) Bevægelse mod asymmetri, især heste der udgår pga. halthed Vil bruge målinger undervejs til at opdage problemer Dias 28/32

Eksempel 2: Smerter ifm. ledbetændelse Lameness score A 1.0 0.5 0.0 0.5 1.0 0 50 100 150 Time after injection Induceret ledbetændelse i knæleddet på højre forben hhv. venstre forben til tid 0 (efter måling). Målt indtil 168 timer. Kan bruges til at undersøge effekt af behandling (ikke vist) Dias 29/32

Konklusion mm. Har forhåbentlig overbevist jer om at accelerationssignaler indeholder information om hestens gangmønster kan bruges som redskab til diagnosticering og kvantificering af halthed, naturligvis som supplement til kliniske undersøgelser Dias 30/32

Konklusion mm. Har forhåbentlig overbevist jer om at accelerationssignaler indeholder information om hestens gangmønster kan bruges som redskab til diagnosticering og kvantificering af halthed, naturligvis som supplement til kliniske undersøgelser Matematikken/statistikken: Funktionel dataanalyse: Hver observation er en funktion Udglatning, alignment, funktionel regression, klassifikation Måske ikke helt egnet til gymnasieelever... Men jeg har en light version af foredraget til gymnasieklasser Dias 30/32

Regression i gymnasiet Dias 31/32

Ideer til regression i gymnasiet Til gengæld tror jeg man vil kunne lave gode forløb om regression i gymnasiet, også i samarbejde med andre fag. Brug/indsaml data! Dias 32/32

Ideer til regression i gymnasiet Til gengæld tror jeg man vil kunne lave gode forløb om regression i gymnasiet, også i samarbejde med andre fag. Brug/indsaml data! Mulige udvidelser af pensum om alm. lineær regression: Udledning af estimater for hældning og skæring (formler) Vil give forståelse for mindste kvadraters metode og kan gennemføres med alm. funktionsundersøgelse. Ikke-lineær regression, fx. med den logistiske funktion Kombinér med grundig undersøgelse af de valgte funktioner Eksponentiel regression og potensregression på original og log-transformeret skala (sammenligninger og validitet) Kvadratisk og/eller multipel regression (flere x er) Logistisk regression, altså situationen med 0/1 respons Dias 32/32