Notat. Testrapport - metode. Deep learning algoritme i billeddannende måleudstyr til måle- og klassificeringsanvendelser

Relaterede dokumenter
Deep Learning. Muligheder og faldgruber. Glenn Gunner Brink Nielsen, Teknologisk Institut

Rapport 23. november 2018

Deep Learning og Computer Vision. C h r i s H o l m b e r g B a h n s e n

At vurdere om NitFom kan anvendes på slagtelinjen til prædiktion af slagtekroppes fedtkvalitet.

KUNSTIG INTELLIGENS KOMMUNAL GAME CHANGER ELLER BARE BUZZ?

Fra sensorer og pixels til machine learning og A.I.

DANMARKS NATIONALBANK

Hvordan kan en computer. DEEP LEARNING et gennembrud inden for kunstig intelligens

Kunstig intelligens kan give lægerne mere tid til patienterne - UgebrevetA4.dk. WATSON Kunstig intelligens kan give lægerne mere tid til patienterne

ADFÆRDS - OG BEVÆGELSESMØNSTRE MIDDELALDERFESTIVAL D AUGUST. Nøgletal på personbevægelser målt under Middelalderfestivallen.

Introduktion til Visual Data Mining and Machine Learning

Automatisering af manuelle processer Dybdescreeningworkshop Slides til workshop 1 Oktober 2017

ISO En guide til den nye standard for luftfiltrering.

Bilag 7 Analyse af alternative statistiske modeller til DEA Dette bilag er en kort beskrivelse af Forsyningssekretariatets valg af DEAmodellen.

Tid Topic Teknologi og teknik 13:30 Introduktion Fra teleologi til deontologi. The Open Source Learning Stream

Matematik, maskiner og metadata

AI is not ROBOTS

Infrarød Screening. med Total Vision anatomi software

Rapport 10. december 2018

Sammendrag Proceskontrol og justering af de automatiske anlæg er et område som er tidskrævende og typisk vil involvere flere operatører.

BILAG 6. SMART SORTERING AF UARBEJDSDYGTIGHEDSERKLÆRINGER

Acceleration af Kollisionsdetektion på Parallelle Computerarkitekturer

Undgå blown packs med ny metode Udnyttelse af registreringssystemer for slagtedata fra kvæg... 2

Satellitdata til landbruget Skaber det værdi eller er det varm luft?

Henrik Bulskov Styltsvig

Bekendtgørelse om ændring af bekendtgørelse om vejning, klassificering og indberetning af markedspriser for slagtekroppe af svin, kvæg og får

AARHUS UNIVERSITET. Antagelse 1. NaturErhvervstyrelsen

Årsrapport for vedr. kontrol med vejning, klassificering og afregning af svin, kvæg og får

Gradueret planteværn på basis af droneoptagelser Jesper Rasmussen Det Natur- og Biovidenskabelige Fakultet, KU

Grundtvigs Sandkasse

Introduktion til projekter

Samfundsøkonomisk betydningen af fodbold i Danmark. Frivillighed

Årsrapport for vedr. kontrol med vejning, klassificering og afregning af svin, kvæg og får

World Robot Olympiad 2019

Machine Learning til forudsigelser af central KPI

Rapport 28. november 2016

Henrik Holton. Optometrist Synscentralen i Vordingborg OPINION: Hjælp fra. Javel, men hvor dårligt skal synet være? VOS

BILAG 3. AUTOMATISERET POSTSORTERING

World Robot Olympiad 2018

DeIC strategi

Professional Series bevægelsesdetektorer Ved, hvornår alarmen skal lyde. Ved, hvornår den ikke skal.

Formål Projektets mål i 2010 var at tilpasse og dokumentere effekt af et værktøj/en procesforbedring, der kan medvirke til forbedret slagtehygiejne.

Førerløse skolebusser

Bioinformatik Open Source Software i biologiens tjeneste

2 Purus Line et design der ses

Beregning af SCOP for varmepumper efter En14825

God praksis ved brug af superviseret machine learning

Efterspørgselsforecasting og Leveringsoptimering

Matematik og PBL. Ole Ravn

Formpipe Kvalitetskontrol

Kickstart din virksomheds digitale rejse

Studieretningsprojekter i machine learning

Undersøgelserne vil danne baggrund for yderligere tiltag som analyse af besætnings- og slagteriforskelle til at identific ere årsager til forskelle.

Eksempler på. Matema'k på tværs. Ole Ravn og Ole Skovsmose

Problembaseret læring - PBL på Aalborg Universitet. Ole Ravn Institut for Læring og Filosofi, Aalborg Universitet

EN SKOLE FOR LIVET ÅRSPLAN 19/20

DM507 Algoritmer og datastrukturer

Procedure Test og træning af lugtdommere til hangrisesortering

Velfærds Partnerskab folder_oplæg_4sidet.indd 1 02/03/

Open Call. Sprint:Digital søger sprint-facilitatorer

Undersøge om øremærker kan aflæses på de ønskede positioner.

Teknologihistorie. Historien bag FIA-metoden

Undersøgelse angående Køge kommunes borgeres kendskab til. Oktober - November Produkt

side 1. Billeddannelsen. Anne Sofie Nielsen. UDDANNELSER I UDVIKLING

Kunstig intelligens i sagsbehandling?

Triangulering af Danmark.

Bilag 6: Bootstrapping

ALGORITMER OG DATA SOM BAGGRUND FOR FORUDSIGELSER 8. KLASSE. Udfordring

4D-modellen for at øge medindflydelsen i Vejle Kommunale Tandpleje

Jan B. Larsen HTX Næstved Computational Thinking Albena Nielsen N. Zahles Gymnasium 2018/2019

Guide my.matche.dk. - HURTIGT OVERBLIK s. 2 eller... - DETALJERET GENNEMGANG s af 12

Evalueringsresultater og inspiration

28. januar IT og ny teknologi. Mads Friborg

Velkommen Grupperne SJ-1 & SJ-2

Kunstig intelligens. Thomas Bolander, Lektor, DTU Compute. Siri-kommissionen, 17. august Thomas Bolander, Siri-kommissionen, 17/8-16 p.

Forbedring af vandkvalitetsforholdene i Tude Å. Prisoverslag for gennemførelse af Handlingsplan.

VIGTIGT - Korrektion vedr. medicinsk udstyr Brilliance CT-systemer og Gemini- og Precedence-systemer, der anvender Brilliance CT

Notat. Vedr. SMARTE løsninger

Jonas Krogslund Jensen Iben Michalik

Oversigt over Forenklede Fælles Mål i forbindelse med kapitlerne i MULTI. Modellering

EVALUERING OG BUSINESS CASES

BKOOL LANCERER ONE, DEN MEST PRISBILLIGE HOMETRAINER MED PROGRESSIV MODSTANDSKURVE

TALENTTILBUD. I samarbejde med ungdomsuddannelserne i Fredericia Kommune

Oplæg til gruppen Kræft til Krafter, sept 2012, udarbejdet af Mark Spence, trænende ergoterapeut, Træning og Rehabilitering Horsens Kommune Deltager:

Avanceret annoncering for De Samvirkende Købmænd

Den 4. november MERVÆRDI LAB

PIXI-udgave af Fagcenter for Socialpsykiatris Udviklingsplan

10 minutter. 10 minutter. 10 minutter. 10 minutter

Jernbanetransport af farligt gods i Danmark

Rapport. Sammendrag. Afprøvning af NIR online udstyr til måling af oksekøds spisekvalitet. Chris Claudi-Magnussen

Ingen grund til at bruge flere penge på offentligt forbrug

Årsrapport for vedr. kontrol med vejning, klassificering og afregning af svin, kvæg og får

Muligheder og begrænsninger i Deep Learning. C h r i s H o l m b e r g B a h n s e n

Indhold. Rapport. Vision-hjælpeværktøj til udvendig kødkontrol kyllinger. Bedømmelse af billeder fra forundersøgelsen. Baggrund...

WEEDS-projektet (Regulering af ukrudt i økologisk planteproduktion)

Georg Mohr i Grundskolen ved Terese Nielsen og Signe Ammitzbøll, Science Talenter

Velfærd gennem digitalisering

Energimærkningsordningen

Koncept for systemforvaltning af den fælles open source kode, herunder procedure for opfølgning på software-versioner af OpenTele

Succes online Træning #1. Odsherred / Google/ i-strategi.dk 5. Marts 2014

Transkript:

Notat 7. december 2018 2006150-02-01 TMO,DBN,GLN,EVO Testrapport - metode Deep learning algoritme i billeddannende måleudstyr til måle- og klassificeringsanvendelser i fødevarevirksomheder. Introduktion Vision teknologi vil blive brugt i utallige sammenhænge i fremtiden. Fremtidens førerløse biler er helt afhængige af vision og ikke mindst en hurtig analyse af billederne. Det er muliggjort af hurtige computere og ikke mindst smarte algoritmer. Algoritmerne er ikke afhængige af den aktuelle problemstilling, hvorfor de også vil kunne anvendes på problemstillinger indenfor fødevareproduktion. Den mest lovende teknologi er Deep learning, TI/DMRI s arbejde med metode og test af denne teknologi er beskrevet nedenfor. Machine learning Neurale netværk Hvad er deep learning? Machine learning er et bredt begreb, men i bredest forstand er målet at udnytte regnekraft i moderne computere til at skabe algoritmer, der er mere præcise og robuste end hvad der kan skabes af mennesker alene. En Machine learning metode består i at træne neurale netværk til at genkende de kategorier, man er interesseret i. Kernen i de fleste Machine/Deep learning metoder til billedanalyse er et kunstigt neuralt netværk. Inspirationen er biologiske neurale netværk, som består af nerveceller, neuroner, og signaludveksling mellem neuronerne. Det kunstige neurale netværk består af knudepunkter (svarer til neuroner) organiseret i flere lag, som repræsenterer hver sin funktion, for eksempel registrering af lodrette eller vandrette kanter i et billede. Registreringen af den givne karakteristik danner input til næste lag af nodes (signaludveksling), og når et netværk trænes, fastlægges, hvor stor vægt hver enkel karakteristik skal have, for at opnå den endelige beskrivelse af billedet. Deep Learning Deep learning er meget store neurale netværk med mange lag imellem input og output. Før udbredelsen af Deep learning indenfor billedklassifikation, udvalgte/genererede mennesker de forventede relevante features, og algoritmen blev trænet på 1

disse features. Den store fordel ved Deep learning indenfor billedanalyse er, at pga. netværkets størrelse og specielle lagtyper, kan netværket gennem træning finde frem til de relevante features. Det betyder samtidig at Deep learning metoder er meget afhængige af data kvaliteten, fordi der ikke er mennesker, der holder netværket i hånden. Eksempel ImageNet ImageNet Challenge er et billedgenkendelses datasæt, der består af 1.2 mio billeder i høj opløsning, som er klassificeret i 1000 forskellige klasser, for eksempel billeder, hvor der er en bil med på billedet, en hund, et menneske osv. Et netværks performance på ImageNet datasættet bruges i dag som en målestok for, hvor godt netværket er. Imagenet er også interessant, fordi man her for første gang så potentialet ved dybe neurale netværk. I 2012 blev det første dybe neurale netværk anvendt i denne konkurrence, hvor det slog nærmeste konkurrent med 10 procentpoint i præcision, hvilket på daværende tidspunkt var helt uhørt. Karakteristik af egnede problemstillinger Hvornår er metoden anvendelig? Deep learning er velegnet til problemstillinger, hvor der er mange billeder af det samme fænomen, som for eksempel slagtekroppe på en slagtelinje, og hvor mennesker er i stand til at gruppere fænomenet/billederne i forskellige klasser. I disse tilfælde vil metoden være en billig og præcis løsning. Diagnostik Eksempel på succesfuld anvendelse Diagnosticering af mange sygdomme baseres på røntgenbilleder, hvor erfarne læger er i stand til at identificere for eksempel lungebetændelse. Et studie, hvor en Deep learning model er trænet på 100.000 røntgenbilleder, klassificeret med hensyn til 14 lungesygdomme, resulterede i færre falsk positive og falsk negative diagnosticeringer end det tilknyttede lægeteam leverede. Mangelfulde data Faldgruber Der findes en række eksempler på nettet, hvor den automatiske algoritme har resulteret i meget uheldige løsninger. I alle disse tilfælde skyldes det utilstrækkelige mængder data, ikke tilstrækkelig repræsentative data, ukorrekte reference-klassificeringer, annoteringer eller et datasæt, som præsenterer et forvredet billede af virkeligheden. TensorFlow Software TensorFlow er et open source Deep learning framework udviklet af Google. Brugeren kan justere vægtningen af hver node med 2

Alternativer henblik på at opnå den bedste performance. TensorFlow har mange indbyggede biblioteker til for eksempel forbehandling af billeder, og da det er baseret på open source framework findes mange eksempler på implementering. Der findes en lang række alternative løsninger, hvor de fleste også er open source produkter. Størst af disse er Pytorch, udviklet af Facebook, som også har oplevet en eksplosiv vækst indenfor det sidste år. TensorFlow er valgt fordi det er det mest fleksible af de kendte frameworks og samtidig har det overhalet ældre frameworks i popularitet på kort tid, især i forhold til produktionsklare systemer. Testmetode Metoden testes med hensyn til dens egnethed til at klassificere målinger/billeder indenfor fødevareproduktion. Testen består af fire dele: 1. Genberegning af et problem fra en slagtelinje analyseret med IBMs Watson software. 2. Sammenligning med Machine learning få grupperinger 3. Klassificering af mange grupper 4. Klassificering på pixel-niveau af billeder, der er vanskelige at annotere Test 1. Genberegning af Watson-eksemplet En slagterivirksomhed stillede en problemstilling til rådighed for test af IBM s Watson software, idet IBM fik adgang til at optage en række billeder inklusiv en ekspert-klassificering/annotering. Samme datasæt blev stillet til rådighed for TI/DMRI med henblik på test med TensorFlow. Billedmængden var begrænset, nemlig kun 300 (150 gode og 150 dårlige). Billederne skulle først forbehandles, idet baggrund og omgivelser skal fjernes, så kun produkter er tilbage i synsfeltet. Derefter blev algoritmen trænet med samme klassifikationssikkerhed, som Watson algoritmen. Figur 1. Illustration af behovet for forbehandling af billedet, så det kun er produktet, som analyseres. 3

Test 2. Halebid Machine learning vs deep learning Diagnosticering af halebid er anvendt til at vise effekten af Deep learning vs. Machine learning. Den første analyse af billederne bestod i at beskrive de forskellige typer læsioner for eksempel areal og afstand fra halespids og dernæst træne en model med disse input-variable og +/- læsion som referencevariabel. Metoden gav knapt 70% korrekt klassificerede. Dernæst blev en Deep learning algoritme fastlagt, som umiddelbart øgede andelen af de korrekt klassificerede til 80%. Til sidst blev en Deep learning algoritme, som på forhånd var trænet på ImageNet billederne, tilpasset den aktuelle problemstilling, hvilket øgede de korrekt klassificerede til 89%. Figur 2. Klassificering af halebid. Test 3. Produkttyper klassificeringsproblemer Ovenstående eksempler har kun omfattet en gruppering i god og dårlig. I det næste eksempel skal produktbetegnelsen af indholdet i kasser fastlægges. Her er udfordringen, at der er flere produktbetegnelser end selv en trænet slagter kan genkende, hvorfor den endelige løsning skal kombineres med ekstra information for eksempel om produktet er fra økologiske grise eller fra varianter af det samme hovedprodukt. Ensartetheden indenfor den samme produkttype er ligeledes en udfordring, idet kasserne kan være mere eller mindre fyldte. Endelig er det en udfordring at få en ligelig repræsentation af alle typer. Alligevel er det lykkedes at opnå 98% korrekt klassificering i 29 klasser. Figur 3. Eksempel på problemstilling med mange klasser. 4

Test 4. Gødningsrester pixelklassifcering Det sidste testeksempel er også klassificering i mange klasser, faktisk helt ned på pixelniveau. Eksemplet er fra arbejdet med at supplere veterinærkontrollens kontrol af gødningsforurening på slagtekroppen med et visionsystem. Her er udfordringen, at selv meget små forureninger er uacceptabelt. Endvidere er annoteringen en udfordring, da det kan være vanskeligt at skelne forurening fra slagtekroppen med hensyn til farve og kontrast. Konklusion Test 1-4 viser, at det er muligt at anvende Deep learning algoritme til at fremstille de ønskede måleresultater fra billeddannende måleudstyr til klassificeringsanvendelser i fødevarevirksomheder. Instituttets egne erfaringer Klassificeringscenter til griseslagtekroppe Slutbemærkning Teknologisk Institut, DMRI, udviklede i 1990 erne et automatisk udstyr, et Klassificeringscenter, til klassificering af griseslagtekroppe, baseret på nær-infrarød lysrefleksionsprofiler opnået med prober, der blev stukket ind i slagtekroppen. Profilerne, syv i alt, viste refleksionen fra spæk og kød i op til 10 cm tykkelse syv steder på kroppen. Profilerne kan opfattes som billeder og et meget enkelt neuralt netværk fastlægger spæk- og kødtykkelser som input til beregning af slagtekroppens totale kødindhold. Udstyret var det mest præcise udstyr i en lang årrække. Klassificeringscenter til kreaturslagtekroppe Referencer 1 2 Parallelt med ovenstående udvikledes et klassificeringsudstyr, KKC2, til kreaturslagtekroppe. Det er baseret på rigtige billeder, hvor især konturen og farverne er vigtige karakteristikker. Formålet er at klassificere slagtekroppe efter kroppens form og fedme ligesom en klassificeringsekspert vil gøre. Dette eksempel ligner de problemstillinger, hvor Deep learning er egnet som løsningsmetode. Præsentation på temamøde 26. november 2018 https://www.teknologisk.dk/40144 Analyse at produkter fra slagtelinjen, der anvendes til at sammenligne med resultaterne fra IBMs. Billeddata samt modeller: Y:\Organization\C028\540 Dataanvendelse\DC Horsens billeder Deltagere Troels Thorsen Mørch Dennis Brandborg Nielsen Glenn G. Brink Nielsen Eli Vibeke Olsen 5