29-09-09. Diskursrelationer



Relaterede dokumenter
Diskussion af interventioner i rehabilitering. Hans Lund, SDU

Projekt DATA step view

Titel: Barry s Bespoke Bakery

Sådan laver du et godt Pitch

Barnets navn: Børnehave: Kommune: Barnets modersmål (kan være mere end et)

Project Step 7. Behavioral modeling of a dual ported register set. 1/8/ L11 Project Step 5 Copyright Joanne DeGroat, ECE, OSU 1

Kunstig intelligens. Thomas Bolander, Lektor, DTU Compute. Siri-kommissionen, 17. august Thomas Bolander, Siri-kommissionen, 17/8-16 p.

Observation Processes:

Operation Manual SMS Air Conditioner Remote Controller Model No.: SR-001

Portal Registration. Check Junk Mail for activation . 1 Click the hyperlink to take you back to the portal to confirm your registration

ATEX direktivet. Vedligeholdelse af ATEX certifikater mv. Steen Christensen

Richter 2013 Presentation Mentor: Professor Evans Philosophy Department Taylor Henderson May 31, 2013

USERTEC USER PRACTICES, TECHNOLOGIES AND RESIDENTIAL ENERGY CONSUMPTION

Årsplan 9. Klasse Engelsk Skoleåret 2015/16

Part 5 Leisure Time and Transport

Økonomiske forecasts og fremskrivninger

Algoritmer og invarianter

Modtageklasser i Tønder Kommune

Deep Learning. Muligheder og faldgruber. Glenn Gunner Brink Nielsen, Teknologisk Institut

Bilag 1: Ekspertinterview m. Karen Sjørup

Årsplan 9. Klasse Engelsk Skoleåret 2016/17

Vores mange brugere på musskema.dk er rigtig gode til at komme med kvalificerede ønsker og behov.

Vina Nguyen HSSP July 13, 2008

Det er muligt at chekce følgende opg. i CodeJudge: og

Bilag: Efterskolerejser i et dannelsesperspektiv. Spørgeskemaundersøgelse blandt alle elever på Ranum Efterskole

Intro til design og brug af korpora

Varme fødder i Grønland Ingeniørens udfordring. Navn: Klasse: Skole:

Tilmelding sker via stads selvbetjening indenfor annonceret tilmeldingsperiode, som du kan se på Studieadministrationens hjemmeside

Brug af logbog i undervisning. Karen Lauterbach Center for Afrikastudier Adjunktpædagogikum 19. Juni 2013

Danske elevers oplevelser af og syn på udeskole

1. Er du dreng eller pige? Dreng29 SORT Pige 32 RØD

Varme fødder i Grønland Ingeniørens udfordring. Navn: Klasse: Skole:

Handlingens rum versus det sociale rum

Pædagogisk kursus for instruktorer gang. Dorte Ågård

Pædagogisk kursus for instruktorer gang. Gry Sandholm Jensen Hanne Buhl

Skriftlig Eksamen Beregnelighed (DM517)

Digitalisering af mobilt vedligehold et win-win scenarie

Denmark. Frilæsning åbner døre. Teaching English. Engelsk fagudvalg. Landskursus Ideer til at planlægge/afholde læsekurser i engelsk.

Orientering om det engelske abstract i studieretningsprojektet og den større skriftlige opgave

Nyhedsmail, december 2013 (scroll down for English version)

Statistik for MPH: oktober Attributable risk, bestemmelse af stikprøvestørrelse (Silva: , )

Remember the Ship, Additional Work

Forskning i socialpædagogik socialpædagogisk forskning?

Medfødt grammatik. Chomskys teori om sprogtilegnelse efterlader to store stridspunkter i forståelsen af børnesprog:

Seminaropgave: Præsentation af idé

Help / Hjælp

En karakteristik af de regulære sprog. Ugens emner. FA minimering [ ] MyHill-Nerode-sætningen en algoritme til minimering af FA er

Brugervejledning. MHL to HDMI Adapter IM750

Frederiksen. Magnetic Field Dem. kit no Kraftlinieplader. Magnetic Field Demonstrator Ac

Brugervejledning. Xperia P TV Dock DK21

sproget.dk en internetportal for det danske sprog

Hvor er mine runde hjørner?

Hvad er NLP. Står for nerve og refererer til nervesystemet og hjernen. Henviser til vores sprog både det talte og kropssproget.

Fejlbeskeder i SMDB. Business Rules Fejlbesked Kommentar. Validate Business Rules. Request- ValidateRequestRegist ration (Rules :1)

MS-H280-Pro Magnetic Stirrer

Nyhedsmail, november 2013 (scroll down for English version)

Thomas Thomsen STANDARD RAPPORT. Adaptive General Reasoning Test

De skriftlige eksamensgenrer i engelsk

Basic statistics for experimental medical researchers

FJENDEBILLEDER DANSK. Theis Hansen 1.3

StarWars-videointro. Start din video på den nørdede måde! Version: August 2012

7 RÅD, DER GØR DIG BEDRE TIL MESSEN!

"Hvad sker der med isterningen i min sodavand?"

Sikkerhedsvejledning

Generalized Probit Model in Design of Dose Finding Experiments. Yuehui Wu Valerii V. Fedorov RSU, GlaxoSmithKline, US

Øjnene, der ser. - sanseintegration eller ADHD. Professionshøjskolen UCC, Psykomotorikuddannelsen

Special VFR. - ved flyvning til mindre flyveplads uden tårnkontrol som ligger indenfor en kontrolzone

Science og matematisk opmærksomhed i pædagogisk praksis. Adjunkt, ph.d. Linda Ahrenkiel, UCL Ph.d.-studerende Stine Mariegaard, SDU

VELKOMMEN 17. juni Præsentation af Det hele menneske i golfen v. David Dickmeiss og Thomas Kiel Larsson

Læsning som mental sundhed. Mette Steenberg Læseforeningen

Software Design (SWD) Spørgsmål 1

Udbud på engelsk i UCL. Skabelon til beskrivelse

Sundhedsprofil for udskolingen i 9. klasse Skoleåret

Første Stifinderprogram blev gennemført i Kernen i programmet har været under videre udvikling i mere end 20 år

Transkript:

Diskursrelationer

Diskursrelationer Diskurs = sammenhæng af udsagn, idéer, definitioner e.l. som udgør kernen i fx en samtale el. et ræsonnement; (DDO)

Diskursrelationer Diskurs = sammenhæng af udsagn, idéer, definitioner e.l. som udgør kernen i fx en samtale el. et ræsonnement; (DDO) Korpus = spr.(elektronisk) samling af tekster der bruges til sproglige el. litterære undersøgelser; (DDO)

Diskursrelationer Koncept: At kunne finde tekster med en form for relation i vilkårligt store tekstsamlinger.

Diskursrelationer Koncept: At kunne finde tekster med en form for relation i vilkårligt store tekstsamlinger. Diskursrelationer viser sig ofte ved markører i teksten, f.eks. Kontrast men Drengen var glad. Men nu græder han.

Diskursrelationer Koncept: At kunne finde tekster med en form for relation i vilkårligt store tekstsamlinger. Diskursrelationer viser sig ofte ved markører i teksten, f.eks. Kontrast men Drengen var glad. Men nu græder han. Forklaring fordi/eftersom Drengen græder, fordi sneen er smeltet.

Diskursrelationer Koncept: At kunne finde tekster med en form for relation i vilkårligt store tekstsamlinger. Diskursrelationer viser sig ofte ved markører i teksten, f.eks. Kontrast men Drengen var glad. Men nu græder han. Forklaring fordi/eftersom Drengen græder, fordi sneen er smeltet. Forudsætning hvis, så Hvis sneen skal blive liggende, så skal det være koldere, end det er nu.

Hvad så når der ikke er nogen markører i en tekst? Behov for vidensbaser med generel viden så flere relationer kan bruges

Hvad så når der ikke er nogen markører i en tekst? Behov for vidensbaser med generel viden så flere relationer kan bruges F.eks.: Om vinteren er det koldt. Det er varmt nu.

Hvad så når der ikke er nogen markører i en tekst? Behov for vidensbaser med generel viden så flere relationer kan bruges F.eks.: Om vinteren er det koldt. Det er varmt nu. Ikke tilgængeligt (endnu...)

Hvad så når der ikke er nogen markører i en tekst? Behov for vidensbaser med generel viden så flere relationer kan bruges F.eks.: Om vinteren er det koldt. Det er varmt nu. Ikke tilgængeligt (endnu...) Wordnets definerer ikke alle potentielle relationer

Hvad så når der ikke er nogen markører i en tekst? Behov for vidensbaser med generel viden så flere relationer kan bruges F.eks.: Om vinteren er det koldt. Det er varmt nu. Ikke tilgængeligt (endnu...) Wordnets definerer ikke alle potentielle relationer Og slet ikke alle tænkelige antonymirelationer

Marcu & Echihabis hypotese: Lexical item pairs can provide clues about the discourse relations that hold between the text spans in which the lexical items occur. (p. 5)

Hvad gør man så? Behov for at definere relationer i tekster

Hvad gør man så? Først skal man definere relationer i og mellem tekster Mange har lavet forskellige definitioner

Hvad gør man så? Behov for at definere relationer i tekster Mange har lavet forskellige definitioner Marcu & Enchihabi forener flere sæt af definitioner ud fra nogle fælles træk

Hvad gør man så? Behov for at definere relationer i tekster Mange har lavet forskellige definitioner Marcu & Enchihabi forener flere sæt af definitioner ud fra nogle fælles træk Behov for at træningsmateriale med oplagte eksempler på de forskellige diskursrelationer

Diskursrelationer Marcu & Echihabis diskursrelationer og typiske markører: 1 Contrast but, although

Diskursrelationer Marcu & Echihabis diskursrelationer og typiske markører: 1 Contrast but, although 2 Cause-explanation-evidence because, thus

Diskursrelationer Marcu & Echihabis diskursrelationer og typiske markører: 1 Contrast but, although 2 Cause-explanation-evidence because, thus 3 Condition If, then

Diskursrelationer Marcu & Echihabis diskursrelationer og typiske markører: 1 Contrast but, although 2 Cause-explanation-evidence because, thus 3 Condition If, then 4 Elaboration for example, which

Diskursrelationer Marcu & Echihabis diskursrelationer og typiske markører: 1 Contrast but, although 2 Cause-explanation-evidence because, thus 3 Condition If, then 4 Elaboration for example, which 5 No relation, same text 2 vilkårlige sætninger fra samme tekst adskilt af mindst 3 sætninger

Diskursrelationer Marcu & Echihabis diskursrelationer og typiske markører: 1 Contrast but, although 2 Cause-explanation-evidence because, thus 3 Condition If, then 4 Elaboration for example, which 5 No relation, same text 2 vilkårlige sætninger fra samme tekst adskilt af mindst 3 sætninger 6 No relation, different texts 2 vilkårlige sætninger fra to forskellige tekster

Marcu & Echihabis forsøg For hver af de 15 mulige kombinationer af diskursrelationer (r a,r b ) trænes en classifier på et korpus uden markører

Marcu & Echihabis forsøg For hver af de 15 mulige kombinationer af diskursrelationer (r a,r b ) trænes en classifier på et korpus uden markører De 15 classifiere testes nu på 5000 eksempler på diskursrelation r a og 5000 eksempler på r b

Marcu & Echihabis forsøg For hver af de 15 mulige kombinationer af diskursrelationer (r a,r b ) trænes en classifier på et korpus uden markører De 15 classifiere testes nu på 5000 eksempler på diskursrelation r a og 5000 eksempler på r b Hvis forsøget går godt, vil classifierne være mere nøjagtige end de 50% som er udgngspunktet

Resultat Højere præcision i opmærkningen end udgangspunktet i to forskellige korpura

Resultat Højere præcision i opmærkningen end udgangspunktet i to forskellige korpura Cause-explanation-evidence vs. Elaborationclassifieren har en nøjagtighed på 93%

Resultat Contrast vs. Elaboration-classifieren viser sig at kunne forbedre et RST (Rhetorical Structure Theory) opmærket korpus med 77%, da den type opmærkning ikke ellers muliggør opmækning af kontrast-relationer uden markeringsord

Resultat Contrast vs. Elaboration-classifieren viser sig at kunne forbedre et RST (Rhetorical Structure Theory) opmærket korpus med 77%, da den type opmærkning ikke ellers muliggør opmækning af kontrast-relationer uden markeringsord Jo større træningskorpus, desto større nøjagtighed for classifieren (se fig. 1)

Hvad kan det så bruges til? Mulighed for at resumere dokumenter Udvælge relevante dokumenter fra en arbitrært stor samling Avancerede question-answering-systemer Duer kun til machine learning. Ikke specielt interessant for lingvister som sådan