Lexi med Simple ord Lexi erstatter svære ord med nemmere synonymer på enhver tekst du læser i din browser 2
Lexi på et Blik [demo] 3
Baggrund PhD-projekt på Københavns Universitet, 2015-18 Personalized and adaptive text simplification Samarbejde med Nota og University of Sheffield, støttet af Nota og Trygfonden 4
Automatisk Tekstsimplificering Et forskningsområde indenfor sprogteknologi Øger adgang til viden, samfundet, kultur, jobs m.fl. ved at automatisk redigere tekst, så den bliver nemmere at læse Første artikler fra 1990'ere, dengang fokus på at gøre tekster nemmere for computere 5
Tekstsimplificering 1990s: simplifcering for computere Steven made an attempt to stop playing Hearts. Steven attempted to stop playing Hearts. His willingness to leave made Gillian upset. He was willing to leave. This made Gillian upset. 6
Tekstsimplificering 2000s: fokus på mennesker Leksikalsk niveau Zuckerberg announced an ambitious effort to... Konkretisering Zuckerberg announced a big plan to... Mia helped Anna wash the car, but got tired soon. Mia helped Anna wash the car. But soon, Mia got tired. 7
Simplificering: Hvorfor? Læseniveauet er ikke altid dér, hvor det skal være Det handler om deltagelse i skolen og i videregående uddannelser på arbejdspladsen i privat kommunikation i kultur i det offentlige liv 8
Målgrupper og deres behov Ordblinde Bogstavskombinationer, lange ord/sætninger Læsebegyndere Sjældne ord, formelt sprog Fremmedsproglærende Bestemte ord, kompliceret syntaks Autister Billedsprog, pronomer 9
Målgrupper og deres behov One size passer IKKE alle. 10
Individuel Simplificering Individuelle behov kræver individuelle løsninger Læseproblemerne er ikke bekendte eller opdagede er meget svært at operationalisere (at kode dem så computeren forstår dem) Hvad gør vi så? 11
adaptiv Simplificering Identificer mulige simplificeringer Simplificer ifølge brugermodel Feedback fra bruger Opdater brugermodel User#512 ======== Long words: 0.214 Long sentences: 0.728 Passive voice: 0.015 Foreign words: 0.543... 13
Adaptiv leksikalsk simplifering 14
Bruger-adaptiv Leksikalsk Simplificering Brugerens valg som ny træningsdata fortune She gave most of her wealth to charity. Model bliver løbende forbedret Bingel, Paetzold and Søgaard (2018) 17
Men Virker det? Yimam og Biermann (2018) Model tilpasses ved at gentræne ranking-modellen på flere og flere annotationer fra samme bruger Fejlreduktion mere end 30% efter 1,000 sætninger Lee og Yeung (2018) Personaliseret complex word identification Bruger-specifiske modeller er bedre end modeller der trænes på generiske datasæt 19
Bliver det for nemt? Folk skal ikke være bange for at læse Rello et al. (2013): Anything which might help [dyslexics] to subjectively perceive reading as being easier, can potentially help them to avoid this vicious circle [of reading less and staying on a low reading level], even if no significant improvement in readability can be demonstrated. Niveauet tilpasses hver eneste bruger 20
Hvor er vi nu? Prototype er ude, tilgængelig på readwithlexi.net Bruger-tilpasset simplificering Simplificering af hele teksten eller enkelte ord Robust på tværs af genrer Altid korrekte synonymer Synonymer til alle ord Analyseværktøjer 21
Lexi: Future work Fler sprog Simplificering af sætninger Transfer af information på tværs af brugermodeller (clustering, multi-task learning) 22
sammenfatning Diverse målgrupper med forskellige behov Der er ingen one-size-fits-all løsning Vi skal have adaptive og personaliserede simplificeringsløsninger 23
Referencer Bingel, J.; Paetzold, G. H.; Søgaard, A. (2018): Lexi: a tool for adaptive, personalized text simplification. Proceedings of COLING. Santa Fe, USA. Lee, John and Chak Yan Yeung (2018). Personalizing Lexical Simplification. In: Proceedings of the 27th International Conference on Computational Linguistics, COLING Paetzold, G., & Specia, L. (2015). LEXenstein: A Framework for Lexical Simplification. In ACL (System Demonstrations) (pp. 85-90). Paetzold, G., & Specia, L. (2017). Lexical Simplification with Neural Ranking. EACL 2017. Luz Rello, Ricardo Baeza-Yates, Stefan Bott, and Horacio Saggion. 2013. Simplify or help?: text simplification strategies for people with dyslexia. In Proceedings of the 10th International CrossDisciplinary Conference on Web Accessibility, page 15. ACM Yimam, Seid Muhie and Chris Biemann (2018). Par4Sim - Adaptive Paraphrasing for Text Simplification. In: Proceedings of the 27th International Conference on Computational Linguistics, COLING 26