Institut for Matematiske Fag Er hesten halt? Diagnosticering og kvantificering af halthed vha. accelerationsdata Helle Sørensen Mød MATH på KU, november 2015
Problemstilling og mål Problemer: Heste bliver halte, og det er vigtigt at opdage det tidligt Ved svag halthed: Forskellige dyrlæger er ofte uenige om hvorvidt hesten er halt, hvor slemt det er, og på hvilket ben En dyrlæge er også ofte uenig med sig selv... Dias 2/32
Problemstilling og mål Problemer: Heste bliver halte, og det er vigtigt at opdage det tidligt Ved svag halthed: Forskellige dyrlæger er ofte uenige om hvorvidt hesten er halt, hvor slemt det er, og på hvilket ben En dyrlæge er også ofte uenig med sig selv... Ønske: Objektiv, personuafhængig metode der kan bruges til som supplement til sædvanlige undersøgelser. Metoden skal være nem at bruge på stedet Dias 2/32
Halthed og accelerationer Ide: En halt hest vil forsøge at mindske trykket den kraft hesten træder med når det halte ben er i jorden Kraft og acceleration er relaterede: F = m a Accelerationer kan nemt måles når hesten løber Kan vi bruge accelerationsdata til at diagnosticere og kvantificere halthed? Data indsamlet af Maj Halling Thomsen m.fl. fra KU. Analyser mm. lavet i samarbejde med min kollega Anders Tolver. Dias 3/32
Er hesten halt the movie Dias 4/32
3D accelerationssignaler Vertical direction Acceleration 1 0 1 2 0 2 4 6 8 Transversal direction Acceleration 1.0 0.0 1.0 0 2 4 6 8 Longitudinal direction Acceleration 2 0 2 4 0 2 4 6 8 Time (gait cycles) Dias 5/32
Acceleration i lodret retning for en rask hest Normal Acceleration 1.5 0.0 1.5 0 2 4 6 8 Time (gait cycles) Lodret acceleration for en rask hest i trav Stor acceleration stort tryk på overfladen Otte fuldt skridtcykler 6 sekunder 1500 datapunkter Tid 0 lige før landing på højre-forben/venstre-bagben Dias 6/32
Ser signalet anderledes ud for halte heste? Normal Acceleration 1.5 0.0 1.5 0 2 4 6 8 Time (gait cycles) Dias 7/32
Ser signalet anderledes ud for halte heste? Normal Acceleration 1.5 0.0 1.5 0 2 4 6 8 Time (gait cycles) Left fore Acceleration 1 0 1 2 0 2 4 6 8 Time (gait cycles) Dias 7/32
Plan Formål: Diagnosticering og kvantificering af halthed vha. accelerationsmålinger. Fra observerede data til gennemsnitscyklus (præ-processering) Diagnosticering vha. en regressionsmodel Kvantificering vha. symmetriscorer Hvis der er tid til sidst: Lidt om regression i gymnasiet... Dias 8/32
Fra observerede data til gennemsnitscyklus Dias 9/32
Funktionelle data Præ-processering: Har: Accelerationer fra otte skridtcyklusser, y j til tid t j Ønskes: Estimat for en gennemsnitlig cyklus, ˆx(t), t (0, 1) Dias 10/32
Funktionelle data Præ-processering: Har: Accelerationer fra otte skridtcyklusser, y j til tid t j Ønskes: Estimat for en gennemsnitlig cyklus, ˆx(t), t (0, 1) Udfordringer: Har diskrete observationer, men ønsker en funktion Den sande funktion er glat, men data er observeret med støj/fejl: y j = x(t j ) + ε j Kan være forskel i timing fra cyklus til cyklus så et simpelt gennemsnit kan være misvisende Dias 10/32
Funktionelle data Præ-processering: Har: Accelerationer fra otte skridtcyklusser, y j til tid t j Ønskes: Estimat for en gennemsnitlig cyklus, ˆx(t), t (0, 1) Udfordringer: Har diskrete observationer, men ønsker en funktion Den sande funktion er glat, men data er observeret med støj/fejl: y j = x(t j ) + ε j Kan være forskel i timing fra cyklus til cyklus så et simpelt gennemsnit kan være misvisende Teknikker: Udglatning, alignment. Stammer fra del af statistikken der kaldes funktionel dataanalyse (FDA). Dias 10/32
Præ-processering Raw data and zero crossings Acceleration 1.0 0.0 1.0 0 2 4 6 8 Time Before alignment After alignment Shift to cosine Acceleration 1.0 0.0 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Time 1.0 0.0 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Time 1.0 0.0 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Time Dias 11/32
Estimeret gennemsnitssignal Et signal består af to halvdele svarende til de to diagonaler. Første halvdel svarer til at hesten står på højre forben og venstre bagben. Nonlame Left fore limb Vertical acceleration 2 1 0 1 2 Vertical acceleration 2 1 0 1 2 0.0 0.2 0.4 0.6 0.8 1.0 Time 0.0 0.2 0.4 0.6 0.8 1.0 Time Dias 12/32
85 gennemsnitssignaler Acceleration 1 0 1 2 LF 1 0 1 2 RF 1 0 1 2 NO 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Acceleration 1 0 1 2 LH 1 0 1 2 RH 1 0 1 2 LF LH NO RF RH 0.0 0.2 0.4 0.6 0.8 1.0 Time 0.0 0.2 0.4 0.6 0.8 1.0 Time 0.0 0.2 0.4 0.6 0.8 1.0 Time Dias 13/32
Diagnosticering vha. en regressionsmodel Dias 14/32
Regression Data og formål med regression: Data: (x 1,y 1 ),...,(x n,y n ) Interesseret i hvordan x i påvirker fordelingen af Y i Dias 15/32
Regression Data og formål med regression: Data: (x 1,y 1 ),...,(x n,y n ) Interesseret i hvordan x i påvirker fordelingen af Y i Sædvanlige situationer: Alm. lineær regression: x i,y i R og vi antager EY i = α +β x i Logistisk regression: x i R, y i {0,1} og vi antager at eα+β x i 1 P(Y i = 1) = 1 + e α+β x, P(Y i = 0) = i 1 + e α+β x i Dias 15/32
Regression Data og formål med regression: Data: (x 1,y 1 ),...,(x n,y n ) Interesseret i hvordan x i påvirker fordelingen af Y i Sædvanlige situationer: Alm. lineær regression: x i,y i R og vi antager EY i = α +β x i Logistisk regression: x i R, y i {0,1} og vi antager at eα+β x i 1 P(Y i = 1) = 1 + e α+β x, P(Y i = 0) = i 1 + e α+β x i I vores situation er x i en funktion (gennemsnitssignalet) og y i kan antage fem ikke-ordnede værdier (NO, LF, LH, RF, RH). Dias 15/32
Funktionel multinomial regression I vores situation er x i en funktion (gennemsnitssignalet) og y i kan antage fem ikke-ordnede værdier (NO, LF, LH, RF, RH). Antagelse om sammenhæng mellem signal og halthedsgruppe: P(Y i = g) = eη g 1 h e η, hvor η g = α g + β g (t) x i (t)dt h 0 Dette antages for alle g {NO,LF,LH,RF,RH} Dias 16/32
Funktionel multinomial regression I vores situation er x i en funktion (gennemsnitssignalet) og y i kan antage fem ikke-ordnede værdier (NO, LF, LH, RF, RH). Antagelse om sammenhæng mellem signal og halthedsgruppe: P(Y i = g) = eη g 1 h e η, hvor η g = α g + β g (t) x i (t)dt h 0 Dette antages for alle g {NO,LF,LH,RF,RH} Bemærk: Et sæt af ukendte parametre for hver gruppe: α g og β g α g R, men β g er en funktion, β g : (0,1) R Normering sikrer at sandsynlighederne summerer til 1 Dias 16/32
Estimation Bestem de værdier α g og de funktioner β g der får modellen til at passe bedst muligt med data. Alle g samtidig. Dette er vanskeligt! Vores løsning baserer sig på basisudviklinger af både x i erne og β g erne Kan vi forstå formen af β g erne? Kan vi genkende noget symmetri i estimaterne? Mest interessant at se på forskelle til NO, dvs. ˆβ g ˆβ NO. Dias 17/32
Estimerede koefficientfunktioner ˆβ g ˆβ NO Left fore normal Right fore normal Difference in betahat 0.5 0.0 0.5 1.0 Difference in betahat 0.5 0.0 0.5 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Time Left hind normal 0.0 0.2 0.4 0.6 0.8 1.0 Time Right hind normal Difference in betahat 0.5 0.0 0.5 1.0 Difference in betahat 0.5 0.0 0.5 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Time 0.0 0.2 0.4 0.6 0.8 1.0 Time Dias 18/32
Klassifikation (prædiktion) Har altså estimater, ˆα g og ˆβ g, og dermed en estimeret model: e ˆη g ˆP(Y = g x) = h e ˆη h 1, hvor ˆη g = ˆα g + ˆβ g (t) x(t)dt 0 Dias 19/32
Klassifikation (prædiktion) Har altså estimater, ˆα g og ˆβ g, og dermed en estimeret model: e ˆη g ˆP(Y = g x) = h e ˆη h 1, hvor ˆη g = ˆα g + ˆβ g (t) x(t)dt 0 Klassifikationsproblem: Ny acc.-måling, x 0 : (0,1) R. Hvad er hestens haltstatus? Beregn P(Y = g x 0 ) for alle fem halthedsgrupper Vælg den gruppe med den største sandsynlighed Hvor god er denne klassifikationsmetode? Dias 19/32
Klassifikationsresultater Leave-one-out studie: For hvert af de 85 signaler: Estimer parametrene vha. alle de andre data Brug estimaterne til at prædiktere gruppen for signalet Dias 20/32
Klassifikationsresultater Leave-one-out studie: For hvert af de 85 signaler: Estimer parametrene vha. alle de andre data Brug estimaterne til at prædiktere gruppen for signalet Prædikteret gruppe Sand gruppe LF LH NO RF RH LF 13 0 2 0 1 LH 1 12 2 1 0 NO 1 1 19 1 1 RF 0 2 1 13 0 RH 1 0 2 0 11 68 signaler klassificeret til korrekt gruppe, (80%); fem signaler mere til korrekt diagonal; kun et signal til forkert diagonal. Dias 20/32
Den største sandsynlighed ifm. klassifikation Correct group Correct diagonal, wrong group Remaining True status LF LH NO RF RH 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 Maximum probability Dias 21/32
Kvantificering af halthed vha. symmetriscorer Dias 22/32
Symmetriscore A Nonlame Left fore limb Vertical acceleration 2 1 0 1 2 Vertical acceleration 2 1 0 1 2 0.0 0.2 0.4 0.6 0.8 1.0 Time 0.0 0.2 0.4 0.6 0.8 1.0 Time Forslag til symmetriscore: log-forskel mellem rødt og blåt areal, ( rødt areal ) A = log blåt areal Vi forventer at A 0 for raske heste, men ikke for halte heste. Dias 23/32
K Ø B E N H A V N S U N I V E R S I T E T Opfører A sig som forventet? RH RF no LH LF 1.5 1.0 0.5 0.0 0.5 A score Data fra 72 heste: Samme grupper som før Halthed i to grader: mild ( ), moderat ( ) Dias 24/32
K Ø B E N H A V N S U N I V E R S I T E T Opfører A sig som forventet? RH RF no LH LF 1.5 1.0 0.5 0.0 0.5 A score Data fra 72 heste: Samme grupper som før Halthed i to grader: mild ( ), moderat ( ) A varierer omkring 0 for raske heste, men ikke for halte heste A > 0 på LF/RH diagonal, og A < 0 på RF/LH diagonal Tendens: A større for moderat end for mild halthed Dias 24/32
Symmetriscore S Nonlame Left fore limb Vertical acceleration 2 1 0 1 2 Vertical acceleration 2 1 0 1 2 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Time Time Forslag til symmetriscore: Log-transformeret, normeret L 2 -afstand, ( x1 (t) x 2 (t) ) 2 dt S = log ( x1 (t) + x 2 (t) ) 2 dt Vi forventer at S er mindre for raske end for halte heste. Dias 25/32
K Ø B E N H A V N S U N I V E R S I T E T Opfører S sig som forventet? RH RF no LH LF 6 5 4 3 2 S score Data fra 72 heste: Samme grupper som før Halthed i to grader: mild ( ), moderat ( ) Dias 26/32
K Ø B E N H A V N S U N I V E R S I T E T Opfører S sig som forventet? RH RF no LH LF 6 5 4 3 2 S score Data fra 72 heste: Samme grupper som før Halthed i to grader: mild ( ), moderat ( ) Stor variation mellem heste S mindre for raske end halte heste, især ved moderat halthed Kan ikke skelne mellem de to diagonaler (forventet) Dias 26/32
Hvad bruges symmetriscorerne til? Husk: Dyrlæger er ofte uenige med hinanden (og sig selv) om graden af halthed Ønskede objektive, person-uafhængige kvantitative mål for halthed (symmetri). S og A er netop sådanne mål! Scorerne bruges i forskningssammenhæng til at undersøge effekten af forskellige påvirkninger på hestes gangmønstre. Dias 27/32
Eksempel 1: Langdistanceridt (120 160 km) A 0.3 0.1 0.1 0.3 Finished Lameness Metabolic Lame/Met 7 6 5 4 S Data indsamlet før og efter langdistanceridt (før efter) Bevægelse mod asymmetri, især heste der udgår pga. halthed Vil bruge målinger undervejs til at opdage problemer Dias 28/32
Eksempel 2: Smerter ifm. ledbetændelse Lameness score A 1.0 0.5 0.0 0.5 1.0 0 50 100 150 Time after injection Induceret ledbetændelse i knæleddet på højre forben hhv. venstre forben til tid 0 (efter måling). Målt indtil 168 timer. Kan bruges til at undersøge effekt af behandling (ikke vist) Dias 29/32
Konklusion mm. Har forhåbentlig overbevist jer om at accelerationssignaler indeholder information om hestens gangmønster kan bruges som redskab til diagnosticering og kvantificering af halthed, naturligvis som supplement til kliniske undersøgelser Dias 30/32
Konklusion mm. Har forhåbentlig overbevist jer om at accelerationssignaler indeholder information om hestens gangmønster kan bruges som redskab til diagnosticering og kvantificering af halthed, naturligvis som supplement til kliniske undersøgelser Matematikken/statistikken: Funktionel dataanalyse: Hver observation er en funktion Udglatning, alignment, funktionel regression, klassifikation Måske ikke helt egnet til gymnasieelever... Men jeg har en light version af foredraget til gymnasieklasser Dias 30/32
Regression i gymnasiet Dias 31/32
Ideer til regression i gymnasiet Til gengæld tror jeg man vil kunne lave gode forløb om regression i gymnasiet, også i samarbejde med andre fag. Brug/indsaml data! Dias 32/32
Ideer til regression i gymnasiet Til gengæld tror jeg man vil kunne lave gode forløb om regression i gymnasiet, også i samarbejde med andre fag. Brug/indsaml data! Mulige udvidelser af pensum om alm. lineær regression: Udledning af estimater for hældning og skæring (formler) Vil give forståelse for mindste kvadraters metode og kan gennemføres med alm. funktionsundersøgelse. Ikke-lineær regression, fx. med den logistiske funktion Kombinér med grundig undersøgelse af de valgte funktioner Eksponentiel regression og potensregression på original og log-transformeret skala (sammenligninger og validitet) Kvadratisk og/eller multipel regression (flere x er) Logistisk regression, altså situationen med 0/1 respons Dias 32/32