Intro til design og brug af korpora
|
|
|
- Elisabeth Mortensen
- 10 år siden
- Visninger:
Transkript
1 Intro til design og brug af korpora Jørg Asmussen Det Danske Sprog- og Litteraturselskab
2 Intro til design og brug korpuslingvistik af korpora Jørg Asmussen Det Danske Sprog- og Litteraturselskab
3 Intro til design og brug korpuslingvistik af korpora Jørg Asmussen Det Danske Sprog- og Litteraturselskab et reklameindslag...
4 Hvad er DSL? Det Danske Sprog- og Litteraturselskab: Tekstudgivelser Sproghistoriske fremstillinger Bibliografier Ordbøger og sprogteknologi
5 Hvad er DSL? Det Danske Sprog- og Litteraturselskab: Tekstudgivelser Bibliografier Ordbøger og sprogteknologi Sproghistoriske fremstillinger
6 Program 1. Tekstkorpora og referencekorpora 2. Korpussammensætning 3. Korpusopmærkning 4. Korpusundersøgelser 5. Fremtiden
7 Korpuslingvistik 1. Sprogbeskrivelse på baggrund af korpora 2. Teori og praksis for hensigtsmæssig opbygning og udnyttelse af korpora
8 Hvad er et korpus?
9 Hvad er et korpus? In the language sciences a corpus is a body of written text or transcribed speech which can serve as a basis for linguistic analysis and description. Kennedy 1998
10 Hvad er et korpus? In the language sciences a corpus is a body of written text or transcribed speech which can serve as a basis for linguistic analysis and description. Kennedy 1998
11 Hvad er et korpus? i digital form In the language sciences a corpus is a body of written text or transcribed speech which can serve as a basis for linguistic analysis and description. Kennedy 1998
12 Hvad er et korpus? i digital form In the language sciences a corpus is a body of written text or transcribed speech which can serve as a basis for linguistic analysis and description. Kennedy 1998
13 Hvad er et korpus? i digital form In the language sciences a corpus is a body of written text or transcribed speech which can serve as a basis for linguistic analysis and description. Kennedy 1998 almensprog el. særsprog
14 Hvad er et korpus? i digital form In the language sciences a corpus is a body of written text or transcribed speech which can serve as a basis for linguistic analysis and description. Kennedy 1998 almensprog el. særsprog
15 Hvad er et korpus? i digital form In the language sciences a corpus is a body of written text or transcribed speech which can serve as a basis for linguistic analysis and description. Kennedy 1998 almensprog el. særsprog stort og balanceret
16 Hvad er et korpus? i digital form In the language sciences a corpus is a body of written text or transcribed speech which can serve as a basis for linguistic analysis and description. Kennedy 1998 almensprog el. særsprog stort og balanceret
17 Hvad er et korpus? i digital form Referencekorpus: In the language sciences a corpus is a body of written antaget text or transcribed repræsentativ speech which can serve as a basis for linguistic analysis and description. stikprøve Kennedy af 1998 sproget almensprog el. særsprog stort og balanceret
18 Referencekorpora Korpus Tekster Ord DDO mio. Korpus mio. Korpus mio.
19 Referencekorpora Korpus Tekster Ord DDO mio. Korpus mio. Korpus mio.
20 Referencekorpora Korpus Tekster Ord DDO mio. Korpus mio. Korpus mio.
21 Referencekorpora Korpus Tekster Ord DDO mio. Korpus mio. Korpus mio. Korpussammensætning eksemplificeres ved DDO s korpus
22 Program 1. Tekstkorpora og referencekorpora 2. Korpussammensætning 3. Korpusopmærkning 4. Korpusundersøgelser 5. Fremtiden
23 Korpussammensætning Tekstinfo
24 Korpussammensætning Tekstinfo Domæne 66 hhv. 12 forskellige værdier, fx geografi, musik, filosofi
25 Korpussammensætning Tekstinfo Domæne Genre 66 hhv. 12 forskellige værdier, fx geografi, musik, filosofi 131 hhv. 17 forskellige værdier, fx roman, interview, essay
26 Korpussammensætning Tekstinfo Domæne Genre Medium 66 hhv. 12 forskellige værdier, fx geografi, musik, 131 filosofi hhv. 17 forskellige værdier, fx roman, interview, 13 essay forskellige værdier, fx bog, avis, dagbog
27 Korpussammensætning Tekstinfo Domæne Genre Medium Sprogtype 66 hhv. 12 forskellige værdier, fx geografi, musik, 131 filosofi hhv. 17 forskellige værdier, fx roman, interview, 13 essay forskellige værdier, fx bog, avis, almensprog dagbog eller fagligt sprog
28 Korpussammensætning Tekstinfo Domæne Genre Medium Sprogtype Udtryk 66 hhv. 12 forskellige værdier, fx geografi, musik, 131 filosofi hhv. 17 forskellige værdier, fx roman, interview, 13 essay forskellige værdier, fx bog, avis, almensprog dagbog eller fagligt sprog talesprog eller skriftsprog
29 Korpussammensætning Tekstinfo Domæne Genre Medium Sprogtype Udtryk Aspekt 66 hhv. 12 forskellige værdier, fx geografi, musik, 131 filosofi hhv. 17 forskellige værdier, fx roman, interview, 13 essay forskellige værdier, fx bog, avis, almensprog dagbog eller fagligt sprog talesprog eller skriftsprog reception eller produktion
30 Korpussammensætning Tekstinfo Domæne Genre Medium Sprogtype Udtryk Aspekt Produktionsår 66 hhv. 12 forskellige værdier, fx geografi, musik, 131 filosofi hhv. 17 forskellige værdier, fx roman, interview, 13 essay forskellige værdier, fx bog, avis, almensprog dagbog eller fagligt sprog talesprog eller skriftsprog reception eller produktion
31 Korpussammensætning Sprogbrugerinfo
32 Korpussammensætning Sprogbrugerinfo Køn mand, kvinde, ukendt
33 Korpussammensætning Sprogbrugerinfo Køn Fødselsår mand, kvinde, ukendt
34 Korpussammensætning Sprogbrugerinfo Køn Fødselsår Fødested mand, kvinde, ukendt frit stednavn
35 Korpussammensætning Sprogbrugerinfo Køn Fødselsår Fødested Dialektområde mand, kvinde, ukendt frit stednavn 11 regioner
36 Korpussammensætning Sprogbrugerinfo Køn Fødselsår Fødested Dialektområde Udannelse mand, kvinde, ukendt frit stednavn 11 regioner fri betegnelse
37 Korpussammensætning Sprogbrugerinfo Køn Fødselsår Fødested Dialektområde Udannelse Erhverv mand, kvinde, ukendt frit stednavn 11 regioner fri betegnelse fri betegnelse
38 Korpussammensætning Sprogbrugerinfo Køn Fødselsår Fødested Dialektområde Udannelse Erhverv Rolle mand, kvinde, ukendt frit stednavn 11 regioner fri betegnelse fx lærer, elev fri betegnelse
39 Korpussammensætning Sprogbrugerinfo Køn Fødselsår Fødested Dialektområde Udannelse Erhverv Rolle
40 Korpussammensætning Header Tekstinfo Domæne Genre Medium Sprogtype Udtryk Aspekt Produktionsår Sprogbrugerinfo Køn Fødselsår Fødested Dialektområde Udannelse Erhverv Rolle
41 Korpussammensætning Header Tekstinfo Sprogbruger
42 Korpussammensætning Korpusenhed Header Tekstinfo Sprogbruger Tekst <p><f>ny DUFT.</f> Den er sødlig. Eksotisk. Så forførende, at den lokker til romantisk eventyr.</p> <p>gracious! Din nye Impulse. Med duften, som er in lige nu hos de fineste parfumehuse i verden.</p> <p>og den milde deovirkning, der holder dig frisk og dejlig.</p> <p>hele dagen.</p> <p><f>gracious.</f></p> <p>deodorant og parfume. Altid en duft for dig.</p> <p><f>impulse</f></p> <p>perfumed deodorant</p> <p>gracious</p>
43 Korpussammensætning <Korpusenhed> <Header> <TxtOpl> <Id>RTng</Id><Restr><Ano>-</Ano><DDO>-</DDO></Restr><Ttit>-</Ttit><Vtit>Vi Unge</ Vtit><Forl>Specialbladsforlaget</Forl><Dat><Dg>-</Dg><Md>3</Md><År>88</År><Si>-</Si></Dat><Lo>3:</ Lo><AlFa>a</AlFa><SkTa>s</SkTa><RePr>r</RePr><Arel>vu</Arel><Medi>bl</Medi> <Genr>rekl</Genr><GnTy>ann</GnTy><Emne>65</Emne><Grp>ViUnge-rekl1KK</Grp><Num>1</ Num><Fil>VIUNREKL</Fil><Omf>715</Omf> </TxtOpl> <SpbOpl> <EfN>?</EfN><FoN>?</FoN><Køn>?</Køn><FøÅr><År>?</År><Si>-</Si></FøÅr><FøS>?</FøS><Bop>?</ Bop><Reg>?</Reg><Udd>?</Udd><Erh>?</Erh><SpV>i</SpV><Rol>?</Rol> </SpbOpl> </Header> <Tekst ID=RTng> <p><f>du HAR ALDRIG SET HAM FØR</f></p><p><f>PLUDSELIG GI'R HAN DIG BLOMSTER</f></ p><p><f>impulse</f></p><p><f>ny DUFT.</f> Den er sødlig. Eksotisk. Så forførende, at den lokker til romantisk eventyr.</p><p>gracious! Din nye Impulse. Med duften, som er in lige nu hos de fineste parfumehuse i verden.</p><p>og den milde deovirkning, der holder dig frisk og dejlig.</p> <p>hele dagen.</p><p><f>gracious.</f></p><p>deodorant og parfume. Altid en duft for dig.</ p><p><f>impulse</f></p><p>perfumed deodorant</p><p>gracious</p> </Tekst> </Korpusenhed>
44 Korpussammensætning <Korpusenhed> <Header> <TxtOpl> <Id>RTng</Id><Restr><Ano>-</Ano><DDO>-</DDO></Restr><Ttit>-</Ttit><Vtit>Vi Unge</ Vtit><Forl>Specialbladsforlaget</Forl><Dat><Dg>-</Dg><Md>3</Md><År>88</År><Si>-</Si></Dat><Lo>3:</ Lo><AlFa>a</AlFa><SkTa>s</SkTa><RePr>r</RePr><Arel>vu</Arel><Medi>bl</Medi> <Genr>rekl</Genr><GnTy>ann</GnTy><Emne>65</Emne><Grp>ViUnge-rekl1KK</Grp><Num>1</ Num><Fil>VIUNREKL</Fil><Omf>715</Omf> </TxtOpl> <SpbOpl> <EfN>?</EfN><FoN>?</FoN><Køn>?</Køn><FøÅr><År>?</År><Si>-</Si></FøÅr><FøS>?</FøS><Bop>?</ Bop><Reg>?</Reg><Udd>?</Udd><Erh>?</Erh><SpV>i</SpV><Rol>?</Rol> </SpbOpl> Tekstinfo Sprogbrugerinfo </Header> Domæne Køn <Tekst ID=RTng> Genre Fødselsår <p><f>du HAR ALDRIG SET HAM FØR</f></p><p><f>PLUDSELIG GI'R HAN DIG BLOMSTER</f></ p><p><f>impulse</f></p><p><f>ny DUFT.</f> Medium Den er sødlig. Fødested Eksotisk. Så forførende, at den lokker til romantisk eventyr.</p><p>gracious! Din nye Impulse. Med duften, som er in lige nu hos de Sprogtype Dialektområde fineste parfumehuse i verden.</p><p>og den milde deovirkning, der holder dig frisk og dejlig.</p> <p>hele dagen.</p><p><f>gracious.</f></p><p>deodorant Udtryk Udannelse og parfume. Altid en duft for dig.</ p><p><f>impulse</f></p><p>perfumed deodorant</p><p>gracious</p> </Tekst> Aspekt Erhverv </Korpusenhed> Produktionsår Rolle
45 Korpussammensætning Korpusenhed Header Tekstinfo Sprogbruger Tekst <p><f>ny DUFT.</f> Den er sødlig. Eksotisk. Så forførende, at den lokker til romantisk eventyr.</p> <p>gracious! Din nye Impulse. Med duften, som er in lige nu hos de fineste parfumehuse i verden.</p> <p>og den milde deovirkning, der holder dig frisk og dejlig.</p> <p>hele dagen.</p> <p><f>gracious.</f></p> <p>deodorant og parfume. Altid en duft for dig.</p> <p><f>impulse</f></p> <p>perfumed deodorant</p> <p>gracious</p>
46 Korpussammensætning korpusenheder sammensat på en balanceret måde
47 Korpussammensætning korpusenheder sammensat på en balanceret måde Referencekorpus over 1980 ernes dansk på 40 mio. ord
48 Program 1. Tekstkorpora og referencekorpora 2. Korpussammensætning 3. Korpusopmærkning 4. Korpusundersøgelser 5. Fremtiden
49 Korpusopmærkning På tekstniveau På ordniveau På andre niveauer: sætning, morfem etc.
50 Korpusopmærkning Behandlet ifm. med headerne På tekstniveau På ordniveau På andre niveauer: sætning, morfem etc.
51 Korpusopmærkning Behandlet ifm. med headerne På tekstniveau På ordniveau På andre niveauer: sætning, morfem etc. Kommer vi ikke ind på
52 Korpusopmærkning Behandlet ifm. med headerne På tekstniveau På ordniveau Eksemplificeres ved Korpus 2000 På andre niveauer: sætning, morfem etc. Kommer vi ikke ind på
53 Abstraktionsniveauer Udgangspunkt: løbende tekst Token- og sætningsopdeling Lemmatisering Ordklassetagging Syntaktisk parsning Semantisk opmærkning
54 Abstraktionsniveauer Udgangspunkt: løbende tekst Token- og sætningsopdeling Lemmatisering Ordklassetagging Syntaktisk parsning Semantisk opmærkning Disse 3 niveauer ser vi nærmere på
55 Tokenopdeling Traditionelt forædlingsarbejde har de samme mål, men må bruge metoder, der er mere tidskrævende, og som ofte gør det svært eller umuligt at overskride arts barriererne.
56 Tokenopdeling Traditionelt forædlingsarbejde har de samme mål, men må bruge metoder, der er mere tidskrævende, og som ofte gør det svært eller umuligt at overskride arts barriererne.
57 Tokenopdeling Traditionelt forædlingsarbejde har de samme mål, men må bruge metoder, der er mere tidskrævende, og som ofte gør det svært eller umuligt at overskride arts barriererne.
58 Tokenopdeling Traditionelt forædlingsarbejde har de samme mål men må bruge metoder der er mere tidskrævende Tokens,,, Traditionelt forædlingsarbejde har de samme mål, men må bruge metoder, der er mere tidskrævende, og som ofte gør det svært eller umuligt at overskride arts barriererne. Tokenadskillere
59 Lemmatisering Traditionelt forædlingsarbejde har de samme mål men må bruge metoder der er mere tidskrævende,,,
60 Lemmatisering Traditionelt forædlingsarbejde har de traditionel forædlingsarbejde have den Lemmaformer (grundformer) samme mål, samme mål men må men måtte bruge metoder, bruge metode der er der være mere tidskrævende, meget tidkrævende
61 Lemmatisering Traditionelt forædlingsarbejde har de traditionel forædlingsarbejde have den Lemmaformer (grundformer) samme mål, samme mål men må men måtte bruge metoder, bruge metode der er der være mere tidskrævende, meget tidkrævende
62 Lemmatisering Traditionelt forædlingsarbejde har de samme mål men må bruge metoder der er mere tidskrævende,,, traditionel forædlingsarbejde have den samme mål men måtte bruge metode der være meget tidkrævende Lemmaformer (grundformer) Lemmatisering forudsætter et fuldformsleksikon og en disambigueringsrutine
63 Ordklassetagging Traditionelt forædlingsarbejde har de samme mål men må bruge metoder der er mere tidskrævende,,, traditionel forædlingsarbejde have den samme mål men måtte bruge metode der være meget tidskrævende
64 Ordklassetagging Traditionelt forædlingsarbejde har de samme mål men må bruge metoder der er mere tidskrævende Ordklassetagging have forudsætter den et fuldformsleksikon samme og en disambigueringsrutine, mål,, traditionel forædlingsarbejde men måtte bruge metode der være meget tidskrævende ADJ N V ART DET N KC V V N INDP V ADV ADJ NEU S IDF NOM NEU S IDF NOM PR AKT ng P DEF ng nn NOM NEU P IDF NOM PR AKT INF AKT UTR P IDF NOM ng nn NOM PR AKT COM ng nn nd NOM Ordklassetags Bøjningstags
65 Tekstformat Traditionelt forædlingsarbejde traditionel forædlingsarbejde ADJ N NEU S IDF NOM NEU S IDF NOM har de have den V ART PR AKT ng P DEF samme mål, samme mål DET N ng nn NOM NEU P IDF NOM men må men måtte KC V PR AKT bruge metoder, bruge metode V N INF AKT UTR P IDF NOM der er der være INDP V ng nn NOM PR AKT mere tidskrævende, meget tidskrævende ADV ADJ COM ng nn nd NOM
66 Tekstformat Traditionelt forædlingsarbejde har de samme mål men må bruge metoder der er Tokens mere tidskrævende,,, traditionel forædlingsarbejde have den samme mål men måtte bruge metode der være meget tidskrævende ADJ N V ART DET N KC V V N INDP V ADV ADJ NEU S IDF NOM NEU S IDF NOM PR AKT ng P DEF ng nn NOM NEU P IDF NOM PR AKT INF AKT UTR P IDF NOM ng nn NOM PR AKT COM ng nn nd NOM
67 Tekstformat Traditionelt forædlingsarbejde har de samme mål men må bruge metoder der er Tokens mere tidskrævende,,, traditionel forædlingsarbejde have den samme mål men måtte bruge metode der være meget tidskrævende ADJ N V ART DET N Attributter KC V PR AKT V INF AKT N UTR P IDF NOM INDP V ADV ADJ NEU S IDF NOM NEU S IDF NOM PR AKT ng P DEF ng nn NOM NEU P IDF NOM ng nn NOM PR AKT COM ng nn nd NOM
68 Program 1. Tekstkorpora og referencekorpora 2. Korpussammensætning 3. Korpusopmærkning 4. Korpusundersøgelser 5. Fremtiden
69 Søgning i korpus En hvilken som helst kombination af tokens og tokenattributter Headeroplysninger kan inddrages
70 Søgning i Korpus 2000 En hvilken som helst kombination af tokens og tokenattributter Headeroplysninger kan inddrages
71 Søgning i Korpus 2000 Visse begrænsninger pga. brugervenlighed En hvilken som helst kombination af tokens og tokenattributter Headeroplysninger kan inddrages Ikke muligt
72 Hvad er Korpus 2000? Referencekorpus over dansk sprog omkring år 2000 Omfang på 28 mio. tokens Sammenlignende undersøgelser med DDO s korpus (Korpus 90)
73 Hvad er Korpus 2000? Referencekorpus over dansk sprog omkring år 2000 Omfang på 28 mio. tokens Sammenlignende undersøgelser med DDO s korpus (Korpus 90)
74 Søgning på lemma
75 Søgning på lemma Gå ind på og indtast et ord Klik her
76 Søgning på lemma
77 Søgning på lemma Det indtastede regn kan både være en form af regn, sb. eller regne, vb. Vælg ønsket lemma... Klik her
78 Søgning på lemma
79 Søgning på lemma Klik her for at se en konkordans over formen regnen, sb. i Korpus 2000 Klik her for at se alle former af lemmaet regn, sb.
80 Søgning på lemma
81 Resultatet er en KWICkonkordans, sorteret Søgning på lemma KWIC = keyword in context
82 Sætningskløvning
83 Sætningskløvning Indtast en gruppe af ord. N og V er pladsholdere. Den lodrette streg betyder eller. Klik her
84 Sætningskløvning
85 Sætningskløvning Klik her Ret til vha. rullemenuerne: er være, vb. N sb. V vb.
86 Sætningskløvning
87 Sætningskløvning OBS! Vær kritisk over for resultatet! Resulterende KWIC-konkordans
88 Mere om søgning På kan man også Søge med regulære udtryk Se ordlister Lave kollokationsundersøgelser Se mere på korpus.dsl.dk/staff/ja/papers/ prag2006/presuniprag.pdf
89 Program 1. Tekstkorpora og referencekorpora 2. Korpussammensætning 3. Korpusopmærkning 4. Korpusundersøgelser 5. Fremtiden
90 Hvad er ordnet.dk?
91 Hvad er ordnet.dk? Igangværende DSL-projekt
92 Hvad er ordnet.dk?
93 Fremtiden ordnet.dk etablerer en samlet tilgang til Korpus 2000 og Korpus 90 Den Danske Ordbog Ordbog over det danske Sprog Følg med på dsl.dk/ordboger-ogsprogteknologi/ordnet.dk
Korpusbaseret lemmaselektion og opdatering
Korpusbaseret lemmaselektion og opdatering Jørg Asmussen Afdeling for Digitale Ordbøger og Tekstkorpora Det Danske Sprog- og Litteraturselskab www.dsl.dk Program 1. Introduktion til DSL 2. Introduktion
Sprogteknologiske resourcer for islandsk leksikografi
Eiríkur Rögnvaldsson Sprogteknologiske resourcer for islandsk leksikografi Seminar om leksikografi og sprogteknologi Schæffergården 31. januar 2010 Foredragets emne Islandsk sprogteknologi omkring århundredskiftet
sproget.dk en internetportal for det danske sprog
sproget.dk en internetportal for det danske sprog Ida Elisabeth Mørch, Dansk Sprognævn Lars Trap-Jensen, Det Danske Sprog- og Litteratuselskab 1 Baggrunden 2003 Sprog på spil 2005 Ekstrabevilling 2006
Korpus 2010 DK-CLARIN
Emne Korpus 2010 DK-CLARIN Fortæller Jørg Asmussen Det Danske Sprog- og Litteraturselskab Tid & Sted Torsdag, 24. maj 2012 NoSSinK, Dansk Sprognævn Mere Denne præsentation findes under http://korpus.dsl.dk/staff/ja/pres/nossink.pdf
Kvantitative metoder inden for korpuslingvistiske projekter
Kvantitative metoder inden for korpuslingvistiske projekter Illustreret ved eksempler fra Den Danske Ordbogs korpus, Korpus 2000 og Korpus 90 Jørg Asmussen Det Danske Sprog- og Litteraturselskab, DSL [email protected]
Korpus 2000 m.fl. Jørg Asmussen, Det Danske Sprog- og Litteraturselskab, DSL. 24. april Korpus / 47
Korpus 2000 mfl Jørg Asmussen, Det Danske Sprog- og Litteraturselskab, DSL 24 april 2006 Korpus 2000 1 / 47 Overblik ODS Den Danske Ordbog Korpus 2000 Flere korpora Søgeværktøjer Det Danske Sprog- og Litteraturselskab:
LEKSIKOGRAFISK TRADITION OG FORNYELSE: Digital revolution eller organisk reformisme? Lars Trap-Jensen NFL, Oslo 2013
LEKSIKOGRAFISK TRADITION OG FORNYELSE: Digital revolution eller organisk reformisme? Lars Trap-Jensen NFL, Oslo 2013 1900 LEKSIKOGRAFISK REVOLUTION? 2000 2 AKADEMIPRINCIPPET: Normerende, opdragende Alle
Fra begreb til bog om Den Danske Begrebsordbog
Fra begreb til bog om Den Danske Begrebsordbog Sanni Nimb Thomas Troelsgård Henrik Lorentzen Det Danske Sprog- og Litteraturselskab København 1/27 Oversigt Genren begrebsordbøger Den Danske Begrebsordbog
At måle og veje korpusser et aspekt af arbejdet bag de store almensproglige korpusser for dansk
At måle og veje korpusser et aspekt af arbejdet bag de store almensproglige korpusser for dansk Jørg Asmussen Det Danske Sprog- og Litteraturselskab www.dsl.dk Bidrag til Bente Maegaard-festskrift KLADDE-VERSION
ordnet.dk ordbøger og korpus på internettet
ordnet.dk ordbøger og korpus på internettet Af Henrik Lorentzen og Lars Trap-Jensen, Det Danske Sprog- og Litteraturselskab Ordnet.dk er et websted der giver samtidig adgang til to ordbøger og et tekstkorpus.
Informationssøgning metoder og scenarier
Informationssøgning metoder og scenarier Patrizia Paggio Center for Sprogteknologi Københavns Universitet [email protected] Disposition Forskellige systemer IR, IE og QA Information Retrieval (IR) Boolean
Teoretisk og Anvendt Sprogvidenskab I Logopædi & (Pædagogisk) Audiologi Efterår 2016 Skriftlig aflevering med peer-feedback Syntaks
Opgave 1: Vigtige begreber 1. Syntagmerne, som udgør sætningens byggesten, er helheder bygget op af ét hovedord, der kan knytte foranstillede og efterstillede bestemmelser til sig. 2. Det rekursive princip,
- Hvad er det, og hvilke fordele kan opnås ved fælles løsninger?
Semantik, ontologi, tesaurus mv. - Hvad er det, og hvilke fordele kan opnås ved fælles løsninger? Seniorforsker, Center for Sprogteknologi, Københavns Universitet Indhold Hvorfor er semantik relevant for
Nyt fra fagkonsulenten august 2018
Nyt fra fagkonsulenten august 2018 Kære kollegaer Fra 1. august 2018 tiltrådte jeg som fagkonsulent for engelsk STX og HF efter at have fungeret som vikar i jobbet det meste af sidste skoleår. Jeg glæder
Eckhard Bick Institut for Sprog og Kommunikation, SDU Odense Universitet [email protected], http://visl.hum.sdu.dk
EN CONSTRAINT GRAMMAR PARSER FOR DANSK Eckhard Bick Institut for Sprog og Kommunikation, SDU Odense Universitet [email protected], http://visl.hum.sdu.dk 1. Projektet Det moderne samfunds udstrakte brug
Systematisk oversigt. Sprogbeskrivelse:
Systematisk oversigt Engelsk Sprogbeskrivelse: Spr 1 Spr 2 Spr 3 Spr 4 Spr 5 Spr 9 Almen og teoretisk lingvistik: 1.1 Oversigter, lærebøger, introduktioner 1.2 Lingvistikkens historie, enkelte lingvister
Teoretisk og Anvendt Sprogvidenskab I Logopædi & (Pædagogisk) Audiologi Efterår 2016 Skriftlig aflevering med peer-feedback Syntaks
Opgave 1: Vigtige begreber 1. Syntagmerne, som udgør sætningens byggesten, er helheder bygget op af ét hovedord, der kan knytte foranstillede og efterstillede bestemmelser til sig. 2. Det rekursive princip,
Semantikopgave Ved Tobias Scavenius
Semantikopgave Ved Tobias Scavenius Opgaveformulering Undersøg hvordan verbet bære er beskrevet semantisk i DDO, sammenhold beskrivelsen med Ruus beskrivelse i Kognitiv semantik på dansk. Undersøg hvordan
The Joanna Briggs Institute EBP Database Vejledning
The Joanna Briggs Institute EBP Database Vejledning Der er adgang til JBI EPB databasen fra databaselisten på Fagbibliotekets hjemmeside, eller hvis du er udenfor hospitalets netværk via fjernadgang til
CorpusEye - Et brugervenligt web-interface for grammatisk opmærkede korpora
Peter Widell og Mette Kunøe (udg.): 10. Møde om Udforskningen af Dansk Sprog Århus 2004 CorpusEye - Et brugervenligt web-interface for grammatisk opmærkede korpora Af Eckhard Bick (Syddansk Universitet)
Sådan bruger du Den Engelske Regnskabsordbog
Sådan bruger du Den Engelske Regnskabsordbog Visning Når du får et søgeresultat, kan du gøre skriften større eller mindre ved at klikke på knapperne yderst til højre på skærmen: større, mindre, nulstil.
Morfologi og syntaks
Morfologi formlære, ordføjningslære - læren om ordenes opbygning og former Morfologi Rod et ord mindste kerne (rodmorfem) Morfologi Rod et ord mindste kerne: hus Morfologi Rod et ord mindste kerne: hus
Web of Science Vejledning
Web of Science Vejledning Der er adgang til Web of Science fra databaselisten på Fagbibliotekets hjemmeside, eller hvis du er udenfor hospitalets netværk via fjernadgang til DEFF (www.tidsskrifter.deff.dk)
Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Evaluering af dansk efter 9 kl på Ahi Internationale Skole Det talte sprog. Fælles Mål. Ahi Internationale Skole.
Evaluering af dansk efter 9 kl på Ahi Internationale Skole 2013-14 Det talte sprog. Fælles Mål kunne lede møder og styre diskussioner udvikle et nuanceret ordog begrebsforråd fremlægge og formidle stof
Sådan bruger du Den Danske Regnskabsordbog
Sådan bruger du Den Danske Regnskabsordbog Visning Når du får et søgeresultat, kan du gøre skriften større eller mindre ved at klikke på knapperne yderst til højre på skærmen: større, mindre, nulstil.
Du skal lære. o o o o o. Om filmen. Filmen er en animationsfilm. Animation betyder at gøre noget levende.
Du skal lære o o o o o At tale om, hvad der sker i filmen på dansk. At lytte godt efter, hvad der bliver sagt i filmen. At læse og forstå korte tekster om filmen på dansk. At skrive ord og sætninger om
Introduktion til korpusværktøjet CoREST
Introduktion til korpusværktøjet CoREST Jørg Asmussen Det Danske Sprog- og Litteraturselskab 17. marts 2015 Denne vejledning vedrører CoREST β (2015). En eventuel opdateret version af vejledningen findes
LEDER LEDER LEDER LEDER LEDER LEDER LEDER LEDER LEDER LEDER LEDER LEDER WALK AND TALK WALK AND TALK WALK AND TALK WALK AND TALK WALK AND TALK
Hvad er det vigtigste for et godt Hvad er det vigtigste for et godt Hvad er det vigtigste for et godt Hvad er det vigtigste for et godt Hvad er det vigtigste for et godt Hvad er det vigtigste for et godt
Censorvejledning Engelsk A, STX Engelsk B, STX 2017-læreplan Maj Line Flintholm, fagkonsulent
Line Flintholm, fagkonsulent [email protected] 33 92 53 83 Indhold. i STX A...1 Det skriftlige opgavesæt STX A...1 Bedømmelsen af opgaven... 1 Hvad prøves der i? STX A... 2 Prøver i opgavesættets
stavning bøjning udtale oprindelse betydning brug Baggrund og omfang
Siden november 2009 har Den Danske Ordbog været tilgængelig på nettet. Redaktionen af Sprogmuseet har i den anledning bedt mig give en omtale af ordbogen, dens omfang og anlæg generelt og mere specifikt
Hvad ved vi nu. om danske talesprog? Redigeret af Frans Gregersen og Tore Kristiansen SPROGFORANDRINGSCENTRET
Hvad ved vi nu om danske talesprog? Redigeret af Frans Gregersen og Tore Kristiansen SPROGFORANDRINGSCENTRET Denne artikel er kapitel 10 i bogen Hvad ved vi nu om danske talesprog? (red. F. Gregersen og
Læringsmål på NIF. Dansk. for yngste-, mellemste- og ældste trinnet 2014/15
Læringsmål på NIF Dansk for yngste-, mellemste- og ældste trinnet 2014/15 Yngste trinnet 2. 3.klasse Det talte sprog bruge sproget til samarbejde stå foran klassen og tale højt og tydeligt; artikulation
29-09-09. Diskursrelationer
Diskursrelationer Diskursrelationer Diskurs = sammenhæng af udsagn, idéer, definitioner e.l. som udgør kernen i fx en samtale el. et ræsonnement; (DDO) Diskursrelationer Diskurs = sammenhæng af udsagn,
Google. SEO, AdWords og Analytics. Thomas T. Sloth - www.i-strategi.dk
Google SEO, AdWords og Analytics Google Engage Dagens agenda Google styrer! SEO Gratis markedsføring AdWords Betalte annoncer Analytics Mål eller dø! Google styrer Hvis du findes på Google, findes du!...
Fagformål for faget tysk
Fagformål for faget tysk Formålet med faget tysk er, at eleverne skal erhverve sig viden, kompetencer og redskaber, der gør dem i stand til at kommunikere på tysk både skriftligt og mundtligt i et klart
Fra bog til base - om implementering af nye edb-programmer ved Ømålsordbogen
Fra bog til base - om implementering af nye edb-programmer ved Ømålsordbogen Henrik Hovmark Ømålsordbogen Afdeling for Dialektforskning Nordisk Forskningsinstitut Njalsgade 136 2300 København S +45 35
DIGITAL HUMANIORA CAFE. 20. April 2015
DIGITAL HUMANIORA CAFE 20. April 2015 CLARIN ERIC Conference 2012 DIGHUMLAB Clarin.dk Stand vedr: Semantisk opmærkning af dansk Bolette S. Pedersen og Sussi Olsen KU-HUM Styregruppen for forskningsinfrastruktur
Vejledning for censorer i skriftlig spansk begyndersprog A, stx. Gl-Spansk digital
Maj 2019 Vejledning for censorer i skriftlig spansk begyndersprog A, stx Gl-Spansk digital Den digitale prøve i spansk begyndersprog A består af to delprøver. Bedømmelsen er en samlet helhedsvurdering
Delma l for Danish. Det talte sprog. Måltaksonomi: Beginners Middlegroup Advanced Efter Y4 Forstå enkle ord og vendinger knyttet til dagligdagen
Delma l for Danish Det talte Måltaksonomi: Beginners Middlegroup Advanced Efter Y4 Forstå enkle ord og vendinger knyttet til dagligdagen Fortælle hvad man har oplevet Fremlægge, fortælle, forklare og interviewe
Årsplan 9.x. dansk 2011-2012 TG. Uge Indhold Materialer, tekster, mm. FællesMål 33 Grammatik Sådansk 34-35 Forberedelser til skolerejsen 36
Uge Indhold Materialer, tekster, mm. FællesMål 33 Grammatik Sådansk 34-35 Forberedelser til skolerejsen 36 Skolerejse Rom 37-38 Mellemkrigstiden - Tom Kristensen: Henrettelsen - demonstrere et analytisk
Potensrækker. Morten Grud Rasmussen 1 10. november 2015. Definition 1 (Potensrække). En potensrække er en uendelig række på formen
Potensrækker Morten Grud Rasmussen 1 10 november 2015 Definition og konvergens af potensrækker Definition 1 Potensrække) En potensrække er en uendelig række på formen a n pz aq n, 1) hvor afsnittene er
6. Regression. Hayati Balo,AAMS. 1. Nils Victor-Jensen, Matematik for adgangskursus, B-niveau 1
6. Regression Hayati Balo,AAMS Følgende fremstilling er baseret på 1. Nils Victor-Jensen, Matematik for adgangskursus, B-niveau 1 6.0 Indledning til funktioner eller matematiske modeller Mange gange kan
Pensum- og uddybende prøvebestemmelser. Russisk
INSTITUT FOR TVÆRKULTURELLE OG REGIONALE STUDIER DET HUMANISTISKE FAKULTET KØBENHAVNS UNIVERSITET - og uddybende prøvebestemmelser for Russisk Studieordning for det centrale fag i Øst- og Sydøsteuropastudier
Årsplan for 4. klasse (dansk)
Årsplan for 4. klasse (dansk) Periode Emne/ fokuspunkt Mål Handleplan Evaluering Aug okt. Helt ærligt Reklamer: trykte og digitale At give et indblik i og overblik over, hvad grundbogen vil byde på i løbet
På Friskolen Østerlund lægger vi i danskundervisningen særligt vægt på
På Friskolen Østerlund lægger vi i danskundervisningen særligt vægt på tale, fremlægge og optræde til morgensamling tidlig læseindlæring og udvikling af læseglæde børnestavning som redskab i den tidlige
Brugervejledning til testsystemet for de nationale test
Brugervejledning til testsystemet for de nationale test frivillige test Booking Version: 1-1-1-1 23-9-2010 side 1 INDLEDNING... 3 OM DENNE VEJLEDNING... 4 MÅLGRUPPER FOR VEJLEDNINGEN... 5 SUPPORT... 5
a. Find ud af mere om sprogteknologi på internettet. Hvad er nogle typiske anvendelser? Hvor mange af dem bruger du i din hverdag?
En computer forstår umiddelbart ikke de sprog vi mennesker taler og skriver. Inden for sprogteknologien (på engelsk: Natural Language Processing eller NLP), der er en gren af kunstig intelligens, beskæftiger
Goanimate til fremmedsprogsundervisning. Danièle Eychenne
Goanimate til fremmedsprogsundervisning [email protected] www.ucc.dk/cfu/ Workshop: 13.00 15.00 Intro Generelt om funktionelle lærermidler Eksempler - opgaven kompleksitet Afprøvning Opsamling GoAnimate Funktionelle
Årsplan for 4. klasse (dansk)
Årsplan for 4. klasse (dansk) Periode Emne/ fokuspunkt Mål Handleplan Evaluering Aug okt. Vi tager på lejrskole d. 28.-30. August. Helt ærligt H.C.A. forløb At give et indblik i og overblik over, hvad
Embase Vejledning. Avanceret søgning (Advanced Search)
Embase Vejledning Der er adgang til Embase fra databaselisten på Fagbibliotekets hjemmeside, eller hvis du er udenfor hospitalets netværk via fjernadgang til DEFF (www.tidsskrifter.deff.dk ) Har du ikke
De skriftlige eksamensgenrer i engelsk
De skriftlige eksamensgenrer i engelsk Stx A og Hf A Man skal skrive et essay på 900-1200 ord, som altid tager udgangspunkt i en tekst. Der er 2 opgaver at vælge imellem, en om en skønlitterær tekst og
Dansk 4. klasse. Periode Emne Mål Evaluering Uge. Eleverne skal i 33. makkerpar lave OL OL London 2012. Lytte aktivt til andre og
Årsplan 2012-13 Dorte Schmidt Dansk 4. klasse Periode Emne Mål Evaluering OL emne Udtrykke forståelse af det Eleverne skal i 33 læste mundtligt og skriftligt makkerpar lave OL OL London 2012 Lytte aktivt
DanNet Fra ordbog til et leksikalsk-semantisk WordNet for dansk
DanNet Fra ordbog til et leksikalsk-semantisk WordNet for dansk Bolette Sandford Pedersen og Jørg Asmussen Kladde-version til LEDA-Nyt, oktober 2006 1 WordNet leksikalsk-semantiske ordnet for alverdens
CD-ORD. Værktøjet til læsning og skrivning. mikro Værkstedet
CD-ORD 8 Værktøjet til læsning og skrivning mikro Værkstedet CD-ORD CD-ORD er et personligt værktøj, der tilbyder støtte til læsning og skrivning for alle - i skolen, på jobbet, under uddannelse eller
Repræsentationer af handlinger og sproghandlinger
Repræsentationer af handlinger og sproghandlinger Generelt: I denne opgave omhandler pensum generelt koblingen mellem IT-systemer, som et medium hvorved brugerne af disse systemer udfører sproghandlinger.
DANNET ET LEKSIKALSK-SEMANTISK WORDNET FOR DANSK
Peter Widell og Ulf Dalvad Berthelsen (udg.): 11. Møde om Udforskningen af Dansk Sprog Århus 2006 DANNET ET LEKSIKALSK-SEMANTISK WORDNET FOR DANSK Af Sanni Nimb (Center for Sprogteknologi, Københavns Universitet)
Sprogteknologi på Færøerne
Sprogteknologi på Færøerne Hjalmar P. Petersen, cand.mag., MA FO-360 Sandavági Færøerne ELEKTRONISKE ORDBØGER OG TEKSTER. FÆRØSK INDLEDNING Der findes ikke mange elektroniske tekster, ejheller tekstbanker,
