HMM- Based Con,nuous Sign Language Recogni,on Using Stochas,c Grammars

Relaterede dokumenter
Vektorer og lineær regression

Vektorer og lineær regression. Peter Harremoës Niels Brock

Matlab script - placering af kran

Matrx-vektor produkt Mikkel H. Brynildsen Lineær Algebra

I Jiu-Jitsu er hilsenen og hilseformen en vigtig bestanddel af træningen med hensyn til respekt, tolerance og sikkerhed.

Teknik baggerslag. Fra baggerslagskast til baggerslag til servemodtagning

Genoptræning. Efter skulderen har været gået af led - konservativ behandling. Regionshospitalet Silkeborg. Center for Planlagt Kirurgi Fysioterapien

5 ARBEJDE MED EDITOREN

Normalfordelingen og Stikprøvefordelinger

Matematik A STX december 2016 vejl. løsning Gratis anvendelse - læs betingelser!

BEMÆRK Fem gentagelser er temmelig sikkert nok.

Grådige algoritmer. Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.

Henrik Bulskov Styltsvig

Opgave: BOW Bowling. Rules of Bowling. danish. BOI 2015, dag 1. Tilgængelig hukommelse: 256 MB

Grådige algoritmer. Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.

!////////////////////////////////////////////////////////////////////////////////////////////////////////////////////

MATEMATIK A. Indhold. 92 videoer.

Undersøgelser af trekanter

Teknisk progression Diskoskast

Projektopgave 1. Navn: Jonas Pedersen Klasse: 3.4 Skole: Roskilde Tekniske Gymnasium Dato: 5/ Vejleder: Jørn Christian Bendtsen Fag: Matematik

1. Grebet : Formen på pilens krop er mange og har mange navne, men her er 3 begreber der kan bruges om pilens krop og det er følgende.

Rytme hæfte - Valsgaard Gymnastikforening

Formålet er, at brugeren får forståelse for, hvordan TGK-systemet fungerer, og hvordan man får det bedste resultat ud af at arbejde med det.

Autoriseret arbejdsmiljørådgiver. Gode løft. ARBEJDSMILJØHUSET, Krondalvej 8, 2610 Rødovre Telefon

Vi arbejder ofte med hovedet fremskudt eller drejet. Derfor har vi brug for at få udspændt vores nakke- og skuldermuskler.

Træningsprogram. Tilhører: Regionshospitalet Horsens. Terapien. Tlf Revideret af Fysioterapeut Michael Rasmussen. D

Trafikudvalget TRU alm. del - Svar på Spørgsmål 566 Offentligt

Skruedyrenes evolution

Sådan udfører du lymfedrænage af venstre arm

i x-aksens retning, så fås ). Forskriften for g fås altså ved i forskriften for f at udskifte alle forekomster af x med x x 0

Det hele med det halve

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

din guide til hurtigt resultat vigtigt! læs her før du træner

Konditionstræningsprogram

Hvad siger statistikken?

AquaMama. Vandtræning for gravide

Geometrisk skæring. Afgørelse af om der findes skæringer blandt geometriske objekter Bestemmelse af alle skæringspunkter

Del Tid Beskrivelse Fokuspunkter

Bevægelses analyse med SkillSpector. Version 1.0 Sidste opdatering: 14/

Integralregning Infinitesimalregning

Vejledning til brug af Skanderborg Kommunes 3D-model

Teknisk progression. Længdespring

Program for styrketræning

Teknik Smash Smashkast

En dissolve er en overblænding mellem to videoklip, så det ene billede langsomt overtages af det andet.

Teknikmærker. FC Skanderborgs teknikmærke. Indholdsfortegnelse. FC Skanderborg. Spillernavn: Baggrund side 2. Teknikmærkerne og afvikling side 3

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Teknisk progression Kuglestød

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

din guide til hurtigt resultat vigtigt! læs her før du træner Svedgaranti og ømme lå og baller Birgitte NymaNN

Kom godt i gang med Fable-robotten

Guns and Roses Brain Break

a. Find ud af mere om sprogteknologi på internettet. Hvad er nogle typiske anvendelser? Hvor mange af dem bruger du i din hverdag?

Metodenotat til analysen:

Aflevering 4: Mindste kvadraters metode

Signalbehandling og matematik 1 (Tidsdiskrete signaler og systemer)

Klinik for ergo- og fysioterapi Rigshospitalet Balance og svimmelhed

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Kapitel 11 Lineær regression

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Fable Kom godt i gang

SKOVFITNESS. SKOVFITNESS er et supplement til din løbetræning. Det er nemlig

Det teknisk-naturvidenskabelige basisår Matematik 1A, Efterår 2005, Hold 3 Prøveopgave B

Viivaa.dk. Træningsprogram FRISK-genoptræning albue generelt. Af: Viivaa Træningsekspert. Øvelse Illustration Træningsfokus Øvelsesdata Kommentar

Iteration af et endomorft kryptosystem. Substitutions-permutations-net (SPN) og inversion. Eksklusiv disjunktion og dens egenskaber

for kvinder Øvelseskort med 12 ugers fitnesstræning

Newton-Raphsons metode

Øvelse 2. Lig på ryggen med armene ned langs siden. Gør nakken lang, pres skuldrene ned i madrassen i ca. 10 sek.

1. Gå i rask tempo i 1 3 min. Kig frem. Gentag efter kort pause (4 gange).

Motorikken Niveau 4. Udarbejdet af KFUMs Idrætsforbund

STÆRKE ARME MED YOGA. 24 Af Anna Miller, yogainstruktør Stylist: Charlotte Høyer Foto: wichmann+bendtsen

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater

Statistisk sproggenkendelse anvendt i kryptoanalyse

Positiv Ridning Systemet Den halve parade Af Henrik Johansen

Analyse af en lineær regression med lav R 2 -værdi

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Kropsrejsen. Bemærkninger: Beskrivelse af øvelse:

UGE 3, TRÆNING 1 OPVARMNING ELEVATED LUNGES. TRICEP OVERHEAD 3 runder á 15 gentagelser. Pause ca. 60 sek. SUMO SQUAT

Fikseret ryg deformitet? Ja Nej Kommentarer Begrænsning af cervical rotation Venstre Højre Kommentarer

Grådige algoritmer. Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.

Undervisningsbeskrivelse

Produktionstræning. Deltagere: Alle. Banen: Hele banen. Øv 3 Øv 4

Matematik 3. klasse Årsplan

Lavet af Ellen, Sophie, Laura Anna, Mads, Kristian og Mathias Fysikrapport blide forsøg Rapport 6, skråt kast med blide Formål Formålet med f

Produkt og marked - matematiske og statistiske metoder

Efter installation af GEM Drive Studio software fra Delta s CD-rom, skal hoved skærmbilledet se således ud: (koden til administrator adgang er: admin)

Kvantitative Metoder 1 - Efterår Dagens program

Notat vedr. interkalibrering af ålegræs

Det er nemmere at indtaste det her hvis programmet er væk

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Energi-øvelser andet sæt.

Matematikken i kunstig intelligens Opgaver om koordinerende robotter

Undervisningsbeskrivelse. 1 af :01. Stamoplysninger til brug ved prøver til gymnasiale uddannelser. Termin(er) 2017/ /19

Danmarks Tekniske Universitet

Matematikken i kunstig intelligens Opgaver om koordinerende robotter LØSNINGER

Program: 1 af 2 denne uge Bemærkning: Distance (m) /

x 2 + y 2 dx dy. f(x, y) = ln(x 2 + y 2 ) + 2 1) Angiv en ligning for tangentplanen til fladen z = f(x, y) i punktet

DGI TRÆNERGUIDEN DGI TRÆNERGUIDEN DGI TRÆNERGUIDEN DGI TRÆNERGUIDEN. Benøvelse med. Armstrækning viskestykke FITNESS BASKET FITNESS BASKET.

Start af Smart PSS 1. Hent af optagelser fra valgte kamera 2. Tidslinjen 4. Afspilning af optagelser 4

Transkript:

HMM- Based Con,nuous Sign Language Recogni,on Using Stochas,c Grammars Hermann Hienz, Britta Bauer, Karl-Friedrich Kraiss, 1999 Kogn.- Forskn. II, IT og Kogn., Kbh., Anders Grove, 18. september 2010

Formål Formål : oversæ@else,l alm. sprog SL ges,k MMI forskellige SL udbredt over stort set hele verden døve og hørende: manglende kendskab 8l hverandres sprog

Krav Krav : automa9sk, real 9me træk- udl.: 13 frames pr. sek. afvente sætn.- analyse (?) video baseret, farver, enkelt kamera, farvede handsker Ensartet baggrund, krav 9l tøj, (belysning?) kun manuelle tegn parametre omfang : lexicon på 52 German SL tegn Hvis fortløbende tegn: behøver ikke pause mellem tegn, kun mellem sætninger gramma9sk velformede tyske SL sætninger Der en sprogmodel for sammenhænge i sprogets form er inddraget uni- og bigram, alenestående / fortløbende tegner atængigt, samme tegner 9l træning og test nøjagighed: 95 %

Tidligere forsøg 1996 Brafffort 44 franske sætninger, Vokabul.: 7 tegn HMM Dataglove Modul for sortering, 92 % genkendelse konven8onelle nonstandard variable Modul for classificering af konven8onelle tegn, 96 % genkendelse 1998 Liang Ouhyoung 1998 Starner Pentland 1997 Metaxas Vogler Taiwan SL, vokabul.: 250 tegn 10 states HMM Dataglove Genkendelse 80,4 % Amerik. SL, korte enkel syntakssætninger, vokabul.: 40 tegn 4 states HMM 1 kamera struktur, vokabul. : 53 tegn HMM 3 kameraer, 3D elektromagne9sk tracking 2 kørsler: uden gramma9k, 92,1 % med gramma9k og bigram- sandsynligheder : 95,8 %

Parametre hånd form retning posi9on bevægelsesretning og den anden : uden / med dominant / ikke dominant Symmetri hoved blik udtryk Mund krop

Problemer hånd og fingre kan være hæmmede (occluded = 9lstoppet/standset?) tegnenes indbyrdes afgrænsninger skal kunne bestemmes automa9sk indbyrdes påvirkninger tegnene imellem ved overgangene tegnerens overordnede bevægelser og ændringer i positur afvigelser i udformningen af samme tegn fra gang 9l gang, herunder tempo, også for samme tegner med kun 1 kamera er det svært og under9den umuligt at komme 9l 3D store mængder data, real 9me processeren besværlig

Hidden Markov Model HMM : Talegenkendelse : gode 9l at tage højde for varia9oner i forskydninger i 9d og volumen SL ogå i 9dsforløb Hvert tegn mindste enhed i sproget, ~ phonem i talt sprog Hvert tegn <- > sin HMM model

Process (fig. 1) Input : billeder optagelse digitalisering segmentering, tegnene afgrænset træk udledet, dannelse af feature vektor Mellemresultat : feature vektorer behandling af feature vektor, genkendelse ved HMM, og assisteret med forenkling ved incorporeret stochas9skgramma9k 9l Output : iden9ficerede / oversaie tegn

Trækudledning handske handske i 8 farver, specifikt iden9ficerer felterne ikke dominant hånd dominant hånd hver finger håndryg håndflade

Trækudledning basis - værdier: funktion : udgangspunkt for træk-parameterværdierne, træk-parameterværdierne er relationer til disse så disse i højere grad svarer til betydning og ikke hele tegner-personens tilfældige orientering og placering værdier: grænseværdier for farverne hvert farvet område udstrækning tyngdepunkt, feltets center skuldres placering kroppens ver9kale akse

Vektor : hånd posi9on x- koordinat, rela9vt 9l krops- aksen y- koordinat, rela9vt 9l højre skulder afstand mellem hændernes tyngdepunkter form alle indbyrdes afstande mellem hvert tyngdepunkt i alle håndens felter retning størrelsen af hvert farvet felt dominant hånds vinkel på fingrene Bevægelses- [? men Llere states ] retning

Markov- model : fig. 3 Bakis: states går fra højre mod venstre hvert tegn ~ 1 model sætnings- sekvens = sum af tegn- HMMer States ini9elt : hvert billede ~ 1 feature vektor ~ 1 state Men med træning : samme tegn i forskellige sekvenser kan have forskellig udstrækning, skal have samme antal states => states ukendt, => HMM

Markov (Viterbi- )Træning : Markov- modellen Absorberer afvigelser for specifikke grænse- 9lstande for tegnene Iden9ficerer grænserne mellem tegnene Lig. 4, model-udviklingsprocessen, to steps: 1. sætnings- /sekvensprocess 2. tegnprocess

sætnings- /sekvens- process træningsdata med hele sætninger beregning af modelparametrene for hele sætningen udledning af tegnenes indbyrdes grænser træningsdata med hele sætninger beregning af modelparametrene for de enkelte tegn modeller for hvert tegn

Tegn- process på baggrund af alle modellerne fra sekvenserne for hvert tegn itereres med viterbi frem mod en endelig model modeller for hvert tegn - > træningsdata med tegn fra hele sætninger alignment af tegnenes states problemer forskellige tegn har forskelligt antal states, eg. 4 30 hvert tegn kan have forskellig udstrækning ini9elt sæies HMM for tegnet 9l det korteste antal states det optræder med, dvs. færrest vektorer ini9alisering af modellen: alle overgange mellem 9lstande sæies 9l lige sandsynlige [fremad?] fra alle forekommende observa9oner fordeles de ligeligt mellem hvert state [?] beregn middelværdi og afvigelse for alle komponent[?]fordelinger i hvert state Viterbialignment[?] kalkuler A- matricen, sandsynlighederne for 9lstandsovergangene undersøg split- ktriteriet[?], skal tætheder spliies[?] hvis itera9onerne har konvergeret i 9lstrækkelig grad, er modellen for tegnet nået. træningsdata med hele sætninger beregning af modelparametrene for de enkelte tegn modeller for hvert tegn

Tegngrænsebestemmelse grænserne kan ikke fastlægges præcist antallet af tegn kendes ikke på forhånd sandsynlighederne for flere mulige afgrænsninger skal bestemmes ikke lineær søgning, men søgning i træ Lig. 5 for ikke at tage for lang tid, skippes en path der ser ud til ikke at have høj nok sandsynlighed tærskel bestemmelse : ved en fastsat variabel, B 0 kandidaten med højest sandsynlighed

Stochas9sk Srogmodelering sandsynligheder for unigram og bigram bigram : sandsynlighed for følge af to tegn, f i hvis f i 1, lille trænings- grundlag Virkemåde: indvirker i vurderingen af sandsynligheder ved fastlæggelsen af grænser melem tegnene

Træning og test tegn af forskellige ordtyper træning : 3, 5 9mer, test: 0,5 9mer videooptagelser Tegner : erfaren bruger Forekomst af tegn er i forskellig rækkefølge i trænings- og testsæt Pauser kun indsat med forsæt mellem sætninger Indeholder minimal pairs Sætningernes længde fra 2 9l 9 tegn

Resultater: Nøjag9ghed: 92 95 %, højere B 0 hjælper stokas9sk gramma9k hjælper, bigram mere end unigram Diskussion god 9l minimal pairs usete tegnovergange i test materialet men mange sleie- fejl korte tegn sværere, en større del af dem er grænseområder en- hånds- tegn, har færre minimal pairs

Krav : automa9sk, real 9me træk- udl.: 13 frames pr. sek. afvente sætn.- analyse (?) video baseret, farver, enkelt kamera, farvede handsker Ensartet baggrund, krav 9l tøj, (belysning?) kun manuelle tegn parametre omfang : lexicon på 52 German SL tegn Hvis fortløbende tegn: behøver ikke pause mellem tegn, kun mellem sætninger gramma9sk velformede tyske SL sætninger Der en sprogmodel for sammenhænge i sprogets form er inddraget uni- og bigram, alenestående / fortløbende tegner atængigt, samme tegner 9l træning og test nøjagighed: 95 % Perspek9ver posi9on x- koordinat, rela9vt 9l krops- aksen y- koordinat, rela9vt 9l højre skulder afstand mellem hændernes tyngdepunkter form alle indbyrdes afstande mellem hvert tyngdepunkt i alle håndens felter retning størrelsen af hvert farvet felt dominant hånds vinkel på fingrene Bevægelses - retning [? men Llere states ] Begrænsninger : Real,me, udførelse, omfang og omgivelser Hvordan under oversæielse med sætnings- HMMen? Hvordan undgås forsinkelse? Kan den simple HMM holde 9l mange flere tegn? Kan man undgå handsken? Hvad med farvefelterne? Kan konturer bruges? Hvordan beskrives de, så de afspejler fingre og håndflade/- ryg? Studiet, med ændret belysning og fokus på konturer? Hvordan gøres modellens læsning uatængig af omgivelser? Hvordan laves indlæringen, så modellen bliver mere robust?