Intro til design og brug af korpora

Størrelse: px
Starte visningen fra side:

Download "Intro til design og brug af korpora"

Transkript

1 Intro til design og brug af korpora Jørg Asmussen Det Danske Sprog- og Litteraturselskab

2 Intro til design og brug korpuslingvistik af korpora Jørg Asmussen Det Danske Sprog- og Litteraturselskab

3 Intro til design og brug korpuslingvistik af korpora Jørg Asmussen Det Danske Sprog- og Litteraturselskab et reklameindslag...

4 Hvad er DSL? Det Danske Sprog- og Litteraturselskab: Tekstudgivelser Sproghistoriske fremstillinger Bibliografier Ordbøger og sprogteknologi

5 Hvad er DSL? Det Danske Sprog- og Litteraturselskab: Tekstudgivelser Bibliografier Ordbøger og sprogteknologi Sproghistoriske fremstillinger

6 Program 1. Tekstkorpora og referencekorpora 2. Korpussammensætning 3. Korpusopmærkning 4. Korpusundersøgelser 5. Fremtiden

7 Korpuslingvistik 1. Sprogbeskrivelse på baggrund af korpora 2. Teori og praksis for hensigtsmæssig opbygning og udnyttelse af korpora

8 Hvad er et korpus?

9 Hvad er et korpus? In the language sciences a corpus is a body of written text or transcribed speech which can serve as a basis for linguistic analysis and description. Kennedy 1998

10 Hvad er et korpus? In the language sciences a corpus is a body of written text or transcribed speech which can serve as a basis for linguistic analysis and description. Kennedy 1998

11 Hvad er et korpus? i digital form In the language sciences a corpus is a body of written text or transcribed speech which can serve as a basis for linguistic analysis and description. Kennedy 1998

12 Hvad er et korpus? i digital form In the language sciences a corpus is a body of written text or transcribed speech which can serve as a basis for linguistic analysis and description. Kennedy 1998

13 Hvad er et korpus? i digital form In the language sciences a corpus is a body of written text or transcribed speech which can serve as a basis for linguistic analysis and description. Kennedy 1998 almensprog el. særsprog

14 Hvad er et korpus? i digital form In the language sciences a corpus is a body of written text or transcribed speech which can serve as a basis for linguistic analysis and description. Kennedy 1998 almensprog el. særsprog

15 Hvad er et korpus? i digital form In the language sciences a corpus is a body of written text or transcribed speech which can serve as a basis for linguistic analysis and description. Kennedy 1998 almensprog el. særsprog stort og balanceret

16 Hvad er et korpus? i digital form In the language sciences a corpus is a body of written text or transcribed speech which can serve as a basis for linguistic analysis and description. Kennedy 1998 almensprog el. særsprog stort og balanceret

17 Hvad er et korpus? i digital form Referencekorpus: In the language sciences a corpus is a body of written antaget text or transcribed repræsentativ speech which can serve as a basis for linguistic analysis and description. stikprøve Kennedy af 1998 sproget almensprog el. særsprog stort og balanceret

18 Referencekorpora Korpus Tekster Ord DDO mio. Korpus mio. Korpus mio.

19 Referencekorpora Korpus Tekster Ord DDO mio. Korpus mio. Korpus mio.

20 Referencekorpora Korpus Tekster Ord DDO mio. Korpus mio. Korpus mio.

21 Referencekorpora Korpus Tekster Ord DDO mio. Korpus mio. Korpus mio. Korpussammensætning eksemplificeres ved DDO s korpus

22 Program 1. Tekstkorpora og referencekorpora 2. Korpussammensætning 3. Korpusopmærkning 4. Korpusundersøgelser 5. Fremtiden

23 Korpussammensætning Tekstinfo

24 Korpussammensætning Tekstinfo Domæne 66 hhv. 12 forskellige værdier, fx geografi, musik, filosofi

25 Korpussammensætning Tekstinfo Domæne Genre 66 hhv. 12 forskellige værdier, fx geografi, musik, filosofi 131 hhv. 17 forskellige værdier, fx roman, interview, essay

26 Korpussammensætning Tekstinfo Domæne Genre Medium 66 hhv. 12 forskellige værdier, fx geografi, musik, 131 filosofi hhv. 17 forskellige værdier, fx roman, interview, 13 essay forskellige værdier, fx bog, avis, dagbog

27 Korpussammensætning Tekstinfo Domæne Genre Medium Sprogtype 66 hhv. 12 forskellige værdier, fx geografi, musik, 131 filosofi hhv. 17 forskellige værdier, fx roman, interview, 13 essay forskellige værdier, fx bog, avis, almensprog dagbog eller fagligt sprog

28 Korpussammensætning Tekstinfo Domæne Genre Medium Sprogtype Udtryk 66 hhv. 12 forskellige værdier, fx geografi, musik, 131 filosofi hhv. 17 forskellige værdier, fx roman, interview, 13 essay forskellige værdier, fx bog, avis, almensprog dagbog eller fagligt sprog talesprog eller skriftsprog

29 Korpussammensætning Tekstinfo Domæne Genre Medium Sprogtype Udtryk Aspekt 66 hhv. 12 forskellige værdier, fx geografi, musik, 131 filosofi hhv. 17 forskellige værdier, fx roman, interview, 13 essay forskellige værdier, fx bog, avis, almensprog dagbog eller fagligt sprog talesprog eller skriftsprog reception eller produktion

30 Korpussammensætning Tekstinfo Domæne Genre Medium Sprogtype Udtryk Aspekt Produktionsår 66 hhv. 12 forskellige værdier, fx geografi, musik, 131 filosofi hhv. 17 forskellige værdier, fx roman, interview, 13 essay forskellige værdier, fx bog, avis, almensprog dagbog eller fagligt sprog talesprog eller skriftsprog reception eller produktion

31 Korpussammensætning Sprogbrugerinfo

32 Korpussammensætning Sprogbrugerinfo Køn mand, kvinde, ukendt

33 Korpussammensætning Sprogbrugerinfo Køn Fødselsår mand, kvinde, ukendt

34 Korpussammensætning Sprogbrugerinfo Køn Fødselsår Fødested mand, kvinde, ukendt frit stednavn

35 Korpussammensætning Sprogbrugerinfo Køn Fødselsår Fødested Dialektområde mand, kvinde, ukendt frit stednavn 11 regioner

36 Korpussammensætning Sprogbrugerinfo Køn Fødselsår Fødested Dialektområde Udannelse mand, kvinde, ukendt frit stednavn 11 regioner fri betegnelse

37 Korpussammensætning Sprogbrugerinfo Køn Fødselsår Fødested Dialektområde Udannelse Erhverv mand, kvinde, ukendt frit stednavn 11 regioner fri betegnelse fri betegnelse

38 Korpussammensætning Sprogbrugerinfo Køn Fødselsår Fødested Dialektområde Udannelse Erhverv Rolle mand, kvinde, ukendt frit stednavn 11 regioner fri betegnelse fx lærer, elev fri betegnelse

39 Korpussammensætning Sprogbrugerinfo Køn Fødselsår Fødested Dialektområde Udannelse Erhverv Rolle

40 Korpussammensætning Header Tekstinfo Domæne Genre Medium Sprogtype Udtryk Aspekt Produktionsår Sprogbrugerinfo Køn Fødselsår Fødested Dialektområde Udannelse Erhverv Rolle

41 Korpussammensætning Header Tekstinfo Sprogbruger

42 Korpussammensætning Korpusenhed Header Tekstinfo Sprogbruger Tekst <p><f>ny DUFT.</f> Den er sødlig. Eksotisk. Så forførende, at den lokker til romantisk eventyr.</p> <p>gracious! Din nye Impulse. Med duften, som er in lige nu hos de fineste parfumehuse i verden.</p> <p>og den milde deovirkning, der holder dig frisk og dejlig.</p> <p>hele dagen.</p> <p><f>gracious.</f></p> <p>deodorant og parfume. Altid en duft for dig.</p> <p><f>impulse</f></p> <p>perfumed deodorant</p> <p>gracious</p>

43 Korpussammensætning <Korpusenhed> <Header> <TxtOpl> <Id>RTng</Id><Restr><Ano>-</Ano><DDO>-</DDO></Restr><Ttit>-</Ttit><Vtit>Vi Unge</ Vtit><Forl>Specialbladsforlaget</Forl><Dat><Dg>-</Dg><Md>3</Md><År>88</År><Si>-</Si></Dat><Lo>3:</ Lo><AlFa>a</AlFa><SkTa>s</SkTa><RePr>r</RePr><Arel>vu</Arel><Medi>bl</Medi> <Genr>rekl</Genr><GnTy>ann</GnTy><Emne>65</Emne><Grp>ViUnge-rekl1KK</Grp><Num>1</ Num><Fil>VIUNREKL</Fil><Omf>715</Omf> </TxtOpl> <SpbOpl> <EfN>?</EfN><FoN>?</FoN><Køn>?</Køn><FøÅr><År>?</År><Si>-</Si></FøÅr><FøS>?</FøS><Bop>?</ Bop><Reg>?</Reg><Udd>?</Udd><Erh>?</Erh><SpV>i</SpV><Rol>?</Rol> </SpbOpl> </Header> <Tekst ID=RTng> <p><f>du HAR ALDRIG SET HAM FØR</f></p><p><f>PLUDSELIG GI'R HAN DIG BLOMSTER</f></ p><p><f>impulse</f></p><p><f>ny DUFT.</f> Den er sødlig. Eksotisk. Så forførende, at den lokker til romantisk eventyr.</p><p>gracious! Din nye Impulse. Med duften, som er in lige nu hos de fineste parfumehuse i verden.</p><p>og den milde deovirkning, der holder dig frisk og dejlig.</p> <p>hele dagen.</p><p><f>gracious.</f></p><p>deodorant og parfume. Altid en duft for dig.</ p><p><f>impulse</f></p><p>perfumed deodorant</p><p>gracious</p> </Tekst> </Korpusenhed>

44 Korpussammensætning <Korpusenhed> <Header> <TxtOpl> <Id>RTng</Id><Restr><Ano>-</Ano><DDO>-</DDO></Restr><Ttit>-</Ttit><Vtit>Vi Unge</ Vtit><Forl>Specialbladsforlaget</Forl><Dat><Dg>-</Dg><Md>3</Md><År>88</År><Si>-</Si></Dat><Lo>3:</ Lo><AlFa>a</AlFa><SkTa>s</SkTa><RePr>r</RePr><Arel>vu</Arel><Medi>bl</Medi> <Genr>rekl</Genr><GnTy>ann</GnTy><Emne>65</Emne><Grp>ViUnge-rekl1KK</Grp><Num>1</ Num><Fil>VIUNREKL</Fil><Omf>715</Omf> </TxtOpl> <SpbOpl> <EfN>?</EfN><FoN>?</FoN><Køn>?</Køn><FøÅr><År>?</År><Si>-</Si></FøÅr><FøS>?</FøS><Bop>?</ Bop><Reg>?</Reg><Udd>?</Udd><Erh>?</Erh><SpV>i</SpV><Rol>?</Rol> </SpbOpl> Tekstinfo Sprogbrugerinfo </Header> Domæne Køn <Tekst ID=RTng> Genre Fødselsår <p><f>du HAR ALDRIG SET HAM FØR</f></p><p><f>PLUDSELIG GI'R HAN DIG BLOMSTER</f></ p><p><f>impulse</f></p><p><f>ny DUFT.</f> Medium Den er sødlig. Fødested Eksotisk. Så forførende, at den lokker til romantisk eventyr.</p><p>gracious! Din nye Impulse. Med duften, som er in lige nu hos de Sprogtype Dialektområde fineste parfumehuse i verden.</p><p>og den milde deovirkning, der holder dig frisk og dejlig.</p> <p>hele dagen.</p><p><f>gracious.</f></p><p>deodorant Udtryk Udannelse og parfume. Altid en duft for dig.</ p><p><f>impulse</f></p><p>perfumed deodorant</p><p>gracious</p> </Tekst> Aspekt Erhverv </Korpusenhed> Produktionsår Rolle

45 Korpussammensætning Korpusenhed Header Tekstinfo Sprogbruger Tekst <p><f>ny DUFT.</f> Den er sødlig. Eksotisk. Så forførende, at den lokker til romantisk eventyr.</p> <p>gracious! Din nye Impulse. Med duften, som er in lige nu hos de fineste parfumehuse i verden.</p> <p>og den milde deovirkning, der holder dig frisk og dejlig.</p> <p>hele dagen.</p> <p><f>gracious.</f></p> <p>deodorant og parfume. Altid en duft for dig.</p> <p><f>impulse</f></p> <p>perfumed deodorant</p> <p>gracious</p>

46 Korpussammensætning korpusenheder sammensat på en balanceret måde

47 Korpussammensætning korpusenheder sammensat på en balanceret måde Referencekorpus over 1980 ernes dansk på 40 mio. ord

48 Program 1. Tekstkorpora og referencekorpora 2. Korpussammensætning 3. Korpusopmærkning 4. Korpusundersøgelser 5. Fremtiden

49 Korpusopmærkning På tekstniveau På ordniveau På andre niveauer: sætning, morfem etc.

50 Korpusopmærkning Behandlet ifm. med headerne På tekstniveau På ordniveau På andre niveauer: sætning, morfem etc.

51 Korpusopmærkning Behandlet ifm. med headerne På tekstniveau På ordniveau På andre niveauer: sætning, morfem etc. Kommer vi ikke ind på

52 Korpusopmærkning Behandlet ifm. med headerne På tekstniveau På ordniveau Eksemplificeres ved Korpus 2000 På andre niveauer: sætning, morfem etc. Kommer vi ikke ind på

53 Abstraktionsniveauer Udgangspunkt: løbende tekst Token- og sætningsopdeling Lemmatisering Ordklassetagging Syntaktisk parsning Semantisk opmærkning

54 Abstraktionsniveauer Udgangspunkt: løbende tekst Token- og sætningsopdeling Lemmatisering Ordklassetagging Syntaktisk parsning Semantisk opmærkning Disse 3 niveauer ser vi nærmere på

55 Tokenopdeling Traditionelt forædlingsarbejde har de samme mål, men må bruge metoder, der er mere tidskrævende, og som ofte gør det svært eller umuligt at overskride arts barriererne.

56 Tokenopdeling Traditionelt forædlingsarbejde har de samme mål, men må bruge metoder, der er mere tidskrævende, og som ofte gør det svært eller umuligt at overskride arts barriererne.

57 Tokenopdeling Traditionelt forædlingsarbejde har de samme mål, men må bruge metoder, der er mere tidskrævende, og som ofte gør det svært eller umuligt at overskride arts barriererne.

58 Tokenopdeling Traditionelt forædlingsarbejde har de samme mål men må bruge metoder der er mere tidskrævende Tokens,,, Traditionelt forædlingsarbejde har de samme mål, men må bruge metoder, der er mere tidskrævende, og som ofte gør det svært eller umuligt at overskride arts barriererne. Tokenadskillere

59 Lemmatisering Traditionelt forædlingsarbejde har de samme mål men må bruge metoder der er mere tidskrævende,,,

60 Lemmatisering Traditionelt forædlingsarbejde har de traditionel forædlingsarbejde have den Lemmaformer (grundformer) samme mål, samme mål men må men måtte bruge metoder, bruge metode der er der være mere tidskrævende, meget tidkrævende

61 Lemmatisering Traditionelt forædlingsarbejde har de traditionel forædlingsarbejde have den Lemmaformer (grundformer) samme mål, samme mål men må men måtte bruge metoder, bruge metode der er der være mere tidskrævende, meget tidkrævende

62 Lemmatisering Traditionelt forædlingsarbejde har de samme mål men må bruge metoder der er mere tidskrævende,,, traditionel forædlingsarbejde have den samme mål men måtte bruge metode der være meget tidkrævende Lemmaformer (grundformer) Lemmatisering forudsætter et fuldformsleksikon og en disambigueringsrutine

63 Ordklassetagging Traditionelt forædlingsarbejde har de samme mål men må bruge metoder der er mere tidskrævende,,, traditionel forædlingsarbejde have den samme mål men måtte bruge metode der være meget tidskrævende

64 Ordklassetagging Traditionelt forædlingsarbejde har de samme mål men må bruge metoder der er mere tidskrævende Ordklassetagging have forudsætter den et fuldformsleksikon samme og en disambigueringsrutine, mål,, traditionel forædlingsarbejde men måtte bruge metode der være meget tidskrævende ADJ N V ART DET N KC V V N INDP V ADV ADJ NEU S IDF NOM NEU S IDF NOM PR AKT ng P DEF ng nn NOM NEU P IDF NOM PR AKT INF AKT UTR P IDF NOM ng nn NOM PR AKT COM ng nn nd NOM Ordklassetags Bøjningstags

65 Tekstformat Traditionelt forædlingsarbejde traditionel forædlingsarbejde ADJ N NEU S IDF NOM NEU S IDF NOM har de have den V ART PR AKT ng P DEF samme mål, samme mål DET N ng nn NOM NEU P IDF NOM men må men måtte KC V PR AKT bruge metoder, bruge metode V N INF AKT UTR P IDF NOM der er der være INDP V ng nn NOM PR AKT mere tidskrævende, meget tidskrævende ADV ADJ COM ng nn nd NOM

66 Tekstformat Traditionelt forædlingsarbejde har de samme mål men må bruge metoder der er Tokens mere tidskrævende,,, traditionel forædlingsarbejde have den samme mål men måtte bruge metode der være meget tidskrævende ADJ N V ART DET N KC V V N INDP V ADV ADJ NEU S IDF NOM NEU S IDF NOM PR AKT ng P DEF ng nn NOM NEU P IDF NOM PR AKT INF AKT UTR P IDF NOM ng nn NOM PR AKT COM ng nn nd NOM

67 Tekstformat Traditionelt forædlingsarbejde har de samme mål men må bruge metoder der er Tokens mere tidskrævende,,, traditionel forædlingsarbejde have den samme mål men måtte bruge metode der være meget tidskrævende ADJ N V ART DET N Attributter KC V PR AKT V INF AKT N UTR P IDF NOM INDP V ADV ADJ NEU S IDF NOM NEU S IDF NOM PR AKT ng P DEF ng nn NOM NEU P IDF NOM ng nn NOM PR AKT COM ng nn nd NOM

68 Program 1. Tekstkorpora og referencekorpora 2. Korpussammensætning 3. Korpusopmærkning 4. Korpusundersøgelser 5. Fremtiden

69 Søgning i korpus En hvilken som helst kombination af tokens og tokenattributter Headeroplysninger kan inddrages

70 Søgning i Korpus 2000 En hvilken som helst kombination af tokens og tokenattributter Headeroplysninger kan inddrages

71 Søgning i Korpus 2000 Visse begrænsninger pga. brugervenlighed En hvilken som helst kombination af tokens og tokenattributter Headeroplysninger kan inddrages Ikke muligt

72 Hvad er Korpus 2000? Referencekorpus over dansk sprog omkring år 2000 Omfang på 28 mio. tokens Sammenlignende undersøgelser med DDO s korpus (Korpus 90)

73 Hvad er Korpus 2000? Referencekorpus over dansk sprog omkring år 2000 Omfang på 28 mio. tokens Sammenlignende undersøgelser med DDO s korpus (Korpus 90)

74 Søgning på lemma

75 Søgning på lemma Gå ind på og indtast et ord Klik her

76 Søgning på lemma

77 Søgning på lemma Det indtastede regn kan både være en form af regn, sb. eller regne, vb. Vælg ønsket lemma... Klik her

78 Søgning på lemma

79 Søgning på lemma Klik her for at se en konkordans over formen regnen, sb. i Korpus 2000 Klik her for at se alle former af lemmaet regn, sb.

80 Søgning på lemma

81 Resultatet er en KWICkonkordans, sorteret Søgning på lemma KWIC = keyword in context

82 Sætningskløvning

83 Sætningskløvning Indtast en gruppe af ord. N og V er pladsholdere. Den lodrette streg betyder eller. Klik her

84 Sætningskløvning

85 Sætningskløvning Klik her Ret til vha. rullemenuerne: er være, vb. N sb. V vb.

86 Sætningskløvning

87 Sætningskløvning OBS! Vær kritisk over for resultatet! Resulterende KWIC-konkordans

88 Mere om søgning På kan man også Søge med regulære udtryk Se ordlister Lave kollokationsundersøgelser Se mere på korpus.dsl.dk/staff/ja/papers/ prag2006/presuniprag.pdf

89 Program 1. Tekstkorpora og referencekorpora 2. Korpussammensætning 3. Korpusopmærkning 4. Korpusundersøgelser 5. Fremtiden

90 Hvad er ordnet.dk?

91 Hvad er ordnet.dk? Igangværende DSL-projekt

92 Hvad er ordnet.dk?

93 Fremtiden ordnet.dk etablerer en samlet tilgang til Korpus 2000 og Korpus 90 Den Danske Ordbog Ordbog over det danske Sprog Følg med på dsl.dk/ordboger-ogsprogteknologi/ordnet.dk

Korpusbaseret lemmaselektion og opdatering

Korpusbaseret lemmaselektion og opdatering Korpusbaseret lemmaselektion og opdatering Jørg Asmussen Afdeling for Digitale Ordbøger og Tekstkorpora Det Danske Sprog- og Litteraturselskab www.dsl.dk Program 1. Introduktion til DSL 2. Introduktion

Læs mere

Sprogteknologiske resourcer for islandsk leksikografi

Sprogteknologiske resourcer for islandsk leksikografi Eiríkur Rögnvaldsson Sprogteknologiske resourcer for islandsk leksikografi Seminar om leksikografi og sprogteknologi Schæffergården 31. januar 2010 Foredragets emne Islandsk sprogteknologi omkring århundredskiftet

Læs mere

sproget.dk en internetportal for det danske sprog

sproget.dk en internetportal for det danske sprog sproget.dk en internetportal for det danske sprog Ida Elisabeth Mørch, Dansk Sprognævn Lars Trap-Jensen, Det Danske Sprog- og Litteratuselskab 1 Baggrunden 2003 Sprog på spil 2005 Ekstrabevilling 2006

Læs mere

Korpus 2010 DK-CLARIN

Korpus 2010 DK-CLARIN Emne Korpus 2010 DK-CLARIN Fortæller Jørg Asmussen Det Danske Sprog- og Litteraturselskab Tid & Sted Torsdag, 24. maj 2012 NoSSinK, Dansk Sprognævn Mere Denne præsentation findes under http://korpus.dsl.dk/staff/ja/pres/nossink.pdf

Læs mere

Kvantitative metoder inden for korpuslingvistiske projekter

Kvantitative metoder inden for korpuslingvistiske projekter Kvantitative metoder inden for korpuslingvistiske projekter Illustreret ved eksempler fra Den Danske Ordbogs korpus, Korpus 2000 og Korpus 90 Jørg Asmussen Det Danske Sprog- og Litteraturselskab, DSL [email protected]

Læs mere

Korpus 2000 m.fl. Jørg Asmussen, Det Danske Sprog- og Litteraturselskab, DSL. 24. april Korpus / 47

Korpus 2000 m.fl. Jørg Asmussen, Det Danske Sprog- og Litteraturselskab, DSL. 24. april Korpus / 47 Korpus 2000 mfl Jørg Asmussen, Det Danske Sprog- og Litteraturselskab, DSL 24 april 2006 Korpus 2000 1 / 47 Overblik ODS Den Danske Ordbog Korpus 2000 Flere korpora Søgeværktøjer Det Danske Sprog- og Litteraturselskab:

Læs mere

LEKSIKOGRAFISK TRADITION OG FORNYELSE: Digital revolution eller organisk reformisme? Lars Trap-Jensen NFL, Oslo 2013

LEKSIKOGRAFISK TRADITION OG FORNYELSE: Digital revolution eller organisk reformisme? Lars Trap-Jensen NFL, Oslo 2013 LEKSIKOGRAFISK TRADITION OG FORNYELSE: Digital revolution eller organisk reformisme? Lars Trap-Jensen NFL, Oslo 2013 1900 LEKSIKOGRAFISK REVOLUTION? 2000 2 AKADEMIPRINCIPPET: Normerende, opdragende Alle

Læs mere

Fra begreb til bog om Den Danske Begrebsordbog

Fra begreb til bog om Den Danske Begrebsordbog Fra begreb til bog om Den Danske Begrebsordbog Sanni Nimb Thomas Troelsgård Henrik Lorentzen Det Danske Sprog- og Litteraturselskab København 1/27 Oversigt Genren begrebsordbøger Den Danske Begrebsordbog

Læs mere

At måle og veje korpusser et aspekt af arbejdet bag de store almensproglige korpusser for dansk

At måle og veje korpusser et aspekt af arbejdet bag de store almensproglige korpusser for dansk At måle og veje korpusser et aspekt af arbejdet bag de store almensproglige korpusser for dansk Jørg Asmussen Det Danske Sprog- og Litteraturselskab www.dsl.dk Bidrag til Bente Maegaard-festskrift KLADDE-VERSION

Læs mere

ordnet.dk ordbøger og korpus på internettet

ordnet.dk ordbøger og korpus på internettet ordnet.dk ordbøger og korpus på internettet Af Henrik Lorentzen og Lars Trap-Jensen, Det Danske Sprog- og Litteraturselskab Ordnet.dk er et websted der giver samtidig adgang til to ordbøger og et tekstkorpus.

Læs mere

Informationssøgning metoder og scenarier

Informationssøgning metoder og scenarier Informationssøgning metoder og scenarier Patrizia Paggio Center for Sprogteknologi Københavns Universitet [email protected] Disposition Forskellige systemer IR, IE og QA Information Retrieval (IR) Boolean

Læs mere

Teoretisk og Anvendt Sprogvidenskab I Logopædi & (Pædagogisk) Audiologi Efterår 2016 Skriftlig aflevering med peer-feedback Syntaks

Teoretisk og Anvendt Sprogvidenskab I Logopædi & (Pædagogisk) Audiologi Efterår 2016 Skriftlig aflevering med peer-feedback Syntaks Opgave 1: Vigtige begreber 1. Syntagmerne, som udgør sætningens byggesten, er helheder bygget op af ét hovedord, der kan knytte foranstillede og efterstillede bestemmelser til sig. 2. Det rekursive princip,

Læs mere

- Hvad er det, og hvilke fordele kan opnås ved fælles løsninger?

- Hvad er det, og hvilke fordele kan opnås ved fælles løsninger? Semantik, ontologi, tesaurus mv. - Hvad er det, og hvilke fordele kan opnås ved fælles løsninger? Seniorforsker, Center for Sprogteknologi, Københavns Universitet Indhold Hvorfor er semantik relevant for

Læs mere

Nyt fra fagkonsulenten august 2018

Nyt fra fagkonsulenten august 2018 Nyt fra fagkonsulenten august 2018 Kære kollegaer Fra 1. august 2018 tiltrådte jeg som fagkonsulent for engelsk STX og HF efter at have fungeret som vikar i jobbet det meste af sidste skoleår. Jeg glæder

Læs mere

Eckhard Bick Institut for Sprog og Kommunikation, SDU Odense Universitet [email protected], http://visl.hum.sdu.dk

Eckhard Bick Institut for Sprog og Kommunikation, SDU Odense Universitet lineb@hum.au.dk, http://visl.hum.sdu.dk EN CONSTRAINT GRAMMAR PARSER FOR DANSK Eckhard Bick Institut for Sprog og Kommunikation, SDU Odense Universitet [email protected], http://visl.hum.sdu.dk 1. Projektet Det moderne samfunds udstrakte brug

Læs mere

Systematisk oversigt. Sprogbeskrivelse:

Systematisk oversigt. Sprogbeskrivelse: Systematisk oversigt Engelsk Sprogbeskrivelse: Spr 1 Spr 2 Spr 3 Spr 4 Spr 5 Spr 9 Almen og teoretisk lingvistik: 1.1 Oversigter, lærebøger, introduktioner 1.2 Lingvistikkens historie, enkelte lingvister

Læs mere

Teoretisk og Anvendt Sprogvidenskab I Logopædi & (Pædagogisk) Audiologi Efterår 2016 Skriftlig aflevering med peer-feedback Syntaks

Teoretisk og Anvendt Sprogvidenskab I Logopædi & (Pædagogisk) Audiologi Efterår 2016 Skriftlig aflevering med peer-feedback Syntaks Opgave 1: Vigtige begreber 1. Syntagmerne, som udgør sætningens byggesten, er helheder bygget op af ét hovedord, der kan knytte foranstillede og efterstillede bestemmelser til sig. 2. Det rekursive princip,

Læs mere

Semantikopgave Ved Tobias Scavenius

Semantikopgave Ved Tobias Scavenius Semantikopgave Ved Tobias Scavenius Opgaveformulering Undersøg hvordan verbet bære er beskrevet semantisk i DDO, sammenhold beskrivelsen med Ruus beskrivelse i Kognitiv semantik på dansk. Undersøg hvordan

Læs mere

The Joanna Briggs Institute EBP Database Vejledning

The Joanna Briggs Institute EBP Database Vejledning The Joanna Briggs Institute EBP Database Vejledning Der er adgang til JBI EPB databasen fra databaselisten på Fagbibliotekets hjemmeside, eller hvis du er udenfor hospitalets netværk via fjernadgang til

Læs mere

CorpusEye - Et brugervenligt web-interface for grammatisk opmærkede korpora

CorpusEye - Et brugervenligt web-interface for grammatisk opmærkede korpora Peter Widell og Mette Kunøe (udg.): 10. Møde om Udforskningen af Dansk Sprog Århus 2004 CorpusEye - Et brugervenligt web-interface for grammatisk opmærkede korpora Af Eckhard Bick (Syddansk Universitet)

Læs mere

Sådan bruger du Den Engelske Regnskabsordbog

Sådan bruger du Den Engelske Regnskabsordbog Sådan bruger du Den Engelske Regnskabsordbog Visning Når du får et søgeresultat, kan du gøre skriften større eller mindre ved at klikke på knapperne yderst til højre på skærmen: større, mindre, nulstil.

Læs mere

Morfologi og syntaks

Morfologi og syntaks Morfologi formlære, ordføjningslære - læren om ordenes opbygning og former Morfologi Rod et ord mindste kerne (rodmorfem) Morfologi Rod et ord mindste kerne: hus Morfologi Rod et ord mindste kerne: hus

Læs mere

Web of Science Vejledning

Web of Science Vejledning Web of Science Vejledning Der er adgang til Web of Science fra databaselisten på Fagbibliotekets hjemmeside, eller hvis du er udenfor hospitalets netværk via fjernadgang til DEFF (www.tidsskrifter.deff.dk)

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Evaluering af dansk efter 9 kl på Ahi Internationale Skole Det talte sprog. Fælles Mål. Ahi Internationale Skole.

Evaluering af dansk efter 9 kl på Ahi Internationale Skole Det talte sprog. Fælles Mål. Ahi Internationale Skole. Evaluering af dansk efter 9 kl på Ahi Internationale Skole 2013-14 Det talte sprog. Fælles Mål kunne lede møder og styre diskussioner udvikle et nuanceret ordog begrebsforråd fremlægge og formidle stof

Læs mere

Sådan bruger du Den Danske Regnskabsordbog

Sådan bruger du Den Danske Regnskabsordbog Sådan bruger du Den Danske Regnskabsordbog Visning Når du får et søgeresultat, kan du gøre skriften større eller mindre ved at klikke på knapperne yderst til højre på skærmen: større, mindre, nulstil.

Læs mere

Du skal lære. o o o o o. Om filmen. Filmen er en animationsfilm. Animation betyder at gøre noget levende.

Du skal lære. o o o o o. Om filmen. Filmen er en animationsfilm. Animation betyder at gøre noget levende. Du skal lære o o o o o At tale om, hvad der sker i filmen på dansk. At lytte godt efter, hvad der bliver sagt i filmen. At læse og forstå korte tekster om filmen på dansk. At skrive ord og sætninger om

Læs mere

Introduktion til korpusværktøjet CoREST

Introduktion til korpusværktøjet CoREST Introduktion til korpusværktøjet CoREST Jørg Asmussen Det Danske Sprog- og Litteraturselskab 17. marts 2015 Denne vejledning vedrører CoREST β (2015). En eventuel opdateret version af vejledningen findes

Læs mere

LEDER LEDER LEDER LEDER LEDER LEDER LEDER LEDER LEDER LEDER LEDER LEDER WALK AND TALK WALK AND TALK WALK AND TALK WALK AND TALK WALK AND TALK

LEDER LEDER LEDER LEDER LEDER LEDER LEDER LEDER LEDER LEDER LEDER LEDER WALK AND TALK WALK AND TALK WALK AND TALK WALK AND TALK WALK AND TALK Hvad er det vigtigste for et godt Hvad er det vigtigste for et godt Hvad er det vigtigste for et godt Hvad er det vigtigste for et godt Hvad er det vigtigste for et godt Hvad er det vigtigste for et godt

Læs mere

Censorvejledning Engelsk A, STX Engelsk B, STX 2017-læreplan Maj Line Flintholm, fagkonsulent

Censorvejledning Engelsk A, STX Engelsk B, STX 2017-læreplan Maj Line Flintholm, fagkonsulent Line Flintholm, fagkonsulent [email protected] 33 92 53 83 Indhold. i STX A...1 Det skriftlige opgavesæt STX A...1 Bedømmelsen af opgaven... 1 Hvad prøves der i? STX A... 2 Prøver i opgavesættets

Læs mere

stavning bøjning udtale oprindelse betydning brug Baggrund og omfang

stavning bøjning udtale oprindelse betydning brug Baggrund og omfang Siden november 2009 har Den Danske Ordbog været tilgængelig på nettet. Redaktionen af Sprogmuseet har i den anledning bedt mig give en omtale af ordbogen, dens omfang og anlæg generelt og mere specifikt

Læs mere

Hvad ved vi nu. om danske talesprog? Redigeret af Frans Gregersen og Tore Kristiansen SPROGFORANDRINGSCENTRET

Hvad ved vi nu. om danske talesprog? Redigeret af Frans Gregersen og Tore Kristiansen SPROGFORANDRINGSCENTRET Hvad ved vi nu om danske talesprog? Redigeret af Frans Gregersen og Tore Kristiansen SPROGFORANDRINGSCENTRET Denne artikel er kapitel 10 i bogen Hvad ved vi nu om danske talesprog? (red. F. Gregersen og

Læs mere

Læringsmål på NIF. Dansk. for yngste-, mellemste- og ældste trinnet 2014/15

Læringsmål på NIF. Dansk. for yngste-, mellemste- og ældste trinnet 2014/15 Læringsmål på NIF Dansk for yngste-, mellemste- og ældste trinnet 2014/15 Yngste trinnet 2. 3.klasse Det talte sprog bruge sproget til samarbejde stå foran klassen og tale højt og tydeligt; artikulation

Læs mere

29-09-09. Diskursrelationer

29-09-09. Diskursrelationer Diskursrelationer Diskursrelationer Diskurs = sammenhæng af udsagn, idéer, definitioner e.l. som udgør kernen i fx en samtale el. et ræsonnement; (DDO) Diskursrelationer Diskurs = sammenhæng af udsagn,

Læs mere

Google. SEO, AdWords og Analytics. Thomas T. Sloth - www.i-strategi.dk

Google. SEO, AdWords og Analytics. Thomas T. Sloth - www.i-strategi.dk Google SEO, AdWords og Analytics Google Engage Dagens agenda Google styrer! SEO Gratis markedsføring AdWords Betalte annoncer Analytics Mål eller dø! Google styrer Hvis du findes på Google, findes du!...

Læs mere

Fagformål for faget tysk

Fagformål for faget tysk Fagformål for faget tysk Formålet med faget tysk er, at eleverne skal erhverve sig viden, kompetencer og redskaber, der gør dem i stand til at kommunikere på tysk både skriftligt og mundtligt i et klart

Læs mere

Fra bog til base - om implementering af nye edb-programmer ved Ømålsordbogen

Fra bog til base - om implementering af nye edb-programmer ved Ømålsordbogen Fra bog til base - om implementering af nye edb-programmer ved Ømålsordbogen Henrik Hovmark Ømålsordbogen Afdeling for Dialektforskning Nordisk Forskningsinstitut Njalsgade 136 2300 København S +45 35

Læs mere

DIGITAL HUMANIORA CAFE. 20. April 2015

DIGITAL HUMANIORA CAFE. 20. April 2015 DIGITAL HUMANIORA CAFE 20. April 2015 CLARIN ERIC Conference 2012 DIGHUMLAB Clarin.dk Stand vedr: Semantisk opmærkning af dansk Bolette S. Pedersen og Sussi Olsen KU-HUM Styregruppen for forskningsinfrastruktur

Læs mere

Vejledning for censorer i skriftlig spansk begyndersprog A, stx. Gl-Spansk digital

Vejledning for censorer i skriftlig spansk begyndersprog A, stx. Gl-Spansk digital Maj 2019 Vejledning for censorer i skriftlig spansk begyndersprog A, stx Gl-Spansk digital Den digitale prøve i spansk begyndersprog A består af to delprøver. Bedømmelsen er en samlet helhedsvurdering

Læs mere

Delma l for Danish. Det talte sprog. Måltaksonomi: Beginners Middlegroup Advanced Efter Y4 Forstå enkle ord og vendinger knyttet til dagligdagen

Delma l for Danish. Det talte sprog. Måltaksonomi: Beginners Middlegroup Advanced Efter Y4 Forstå enkle ord og vendinger knyttet til dagligdagen Delma l for Danish Det talte Måltaksonomi: Beginners Middlegroup Advanced Efter Y4 Forstå enkle ord og vendinger knyttet til dagligdagen Fortælle hvad man har oplevet Fremlægge, fortælle, forklare og interviewe

Læs mere

Årsplan 9.x. dansk 2011-2012 TG. Uge Indhold Materialer, tekster, mm. FællesMål 33 Grammatik Sådansk 34-35 Forberedelser til skolerejsen 36

Årsplan 9.x. dansk 2011-2012 TG. Uge Indhold Materialer, tekster, mm. FællesMål 33 Grammatik Sådansk 34-35 Forberedelser til skolerejsen 36 Uge Indhold Materialer, tekster, mm. FællesMål 33 Grammatik Sådansk 34-35 Forberedelser til skolerejsen 36 Skolerejse Rom 37-38 Mellemkrigstiden - Tom Kristensen: Henrettelsen - demonstrere et analytisk

Læs mere

Potensrækker. Morten Grud Rasmussen 1 10. november 2015. Definition 1 (Potensrække). En potensrække er en uendelig række på formen

Potensrækker. Morten Grud Rasmussen 1 10. november 2015. Definition 1 (Potensrække). En potensrække er en uendelig række på formen Potensrækker Morten Grud Rasmussen 1 10 november 2015 Definition og konvergens af potensrækker Definition 1 Potensrække) En potensrække er en uendelig række på formen a n pz aq n, 1) hvor afsnittene er

Læs mere

6. Regression. Hayati Balo,AAMS. 1. Nils Victor-Jensen, Matematik for adgangskursus, B-niveau 1

6. Regression. Hayati Balo,AAMS. 1. Nils Victor-Jensen, Matematik for adgangskursus, B-niveau 1 6. Regression Hayati Balo,AAMS Følgende fremstilling er baseret på 1. Nils Victor-Jensen, Matematik for adgangskursus, B-niveau 1 6.0 Indledning til funktioner eller matematiske modeller Mange gange kan

Læs mere

Pensum- og uddybende prøvebestemmelser. Russisk

Pensum- og uddybende prøvebestemmelser. Russisk INSTITUT FOR TVÆRKULTURELLE OG REGIONALE STUDIER DET HUMANISTISKE FAKULTET KØBENHAVNS UNIVERSITET - og uddybende prøvebestemmelser for Russisk Studieordning for det centrale fag i Øst- og Sydøsteuropastudier

Læs mere

Årsplan for 4. klasse (dansk)

Årsplan for 4. klasse (dansk) Årsplan for 4. klasse (dansk) Periode Emne/ fokuspunkt Mål Handleplan Evaluering Aug okt. Helt ærligt Reklamer: trykte og digitale At give et indblik i og overblik over, hvad grundbogen vil byde på i løbet

Læs mere

På Friskolen Østerlund lægger vi i danskundervisningen særligt vægt på

På Friskolen Østerlund lægger vi i danskundervisningen særligt vægt på På Friskolen Østerlund lægger vi i danskundervisningen særligt vægt på tale, fremlægge og optræde til morgensamling tidlig læseindlæring og udvikling af læseglæde børnestavning som redskab i den tidlige

Læs mere

Brugervejledning til testsystemet for de nationale test

Brugervejledning til testsystemet for de nationale test Brugervejledning til testsystemet for de nationale test frivillige test Booking Version: 1-1-1-1 23-9-2010 side 1 INDLEDNING... 3 OM DENNE VEJLEDNING... 4 MÅLGRUPPER FOR VEJLEDNINGEN... 5 SUPPORT... 5

Læs mere

a. Find ud af mere om sprogteknologi på internettet. Hvad er nogle typiske anvendelser? Hvor mange af dem bruger du i din hverdag?

a. Find ud af mere om sprogteknologi på internettet. Hvad er nogle typiske anvendelser? Hvor mange af dem bruger du i din hverdag? En computer forstår umiddelbart ikke de sprog vi mennesker taler og skriver. Inden for sprogteknologien (på engelsk: Natural Language Processing eller NLP), der er en gren af kunstig intelligens, beskæftiger

Læs mere

Goanimate til fremmedsprogsundervisning. Danièle Eychenne

Goanimate til fremmedsprogsundervisning. Danièle Eychenne Goanimate til fremmedsprogsundervisning [email protected] www.ucc.dk/cfu/ Workshop: 13.00 15.00 Intro Generelt om funktionelle lærermidler Eksempler - opgaven kompleksitet Afprøvning Opsamling GoAnimate Funktionelle

Læs mere

Årsplan for 4. klasse (dansk)

Årsplan for 4. klasse (dansk) Årsplan for 4. klasse (dansk) Periode Emne/ fokuspunkt Mål Handleplan Evaluering Aug okt. Vi tager på lejrskole d. 28.-30. August. Helt ærligt H.C.A. forløb At give et indblik i og overblik over, hvad

Læs mere

Embase Vejledning. Avanceret søgning (Advanced Search)

Embase Vejledning. Avanceret søgning (Advanced Search) Embase Vejledning Der er adgang til Embase fra databaselisten på Fagbibliotekets hjemmeside, eller hvis du er udenfor hospitalets netværk via fjernadgang til DEFF (www.tidsskrifter.deff.dk ) Har du ikke

Læs mere

De skriftlige eksamensgenrer i engelsk

De skriftlige eksamensgenrer i engelsk De skriftlige eksamensgenrer i engelsk Stx A og Hf A Man skal skrive et essay på 900-1200 ord, som altid tager udgangspunkt i en tekst. Der er 2 opgaver at vælge imellem, en om en skønlitterær tekst og

Læs mere

Dansk 4. klasse. Periode Emne Mål Evaluering Uge. Eleverne skal i 33. makkerpar lave OL OL London 2012. Lytte aktivt til andre og

Dansk 4. klasse. Periode Emne Mål Evaluering Uge. Eleverne skal i 33. makkerpar lave OL OL London 2012. Lytte aktivt til andre og Årsplan 2012-13 Dorte Schmidt Dansk 4. klasse Periode Emne Mål Evaluering OL emne Udtrykke forståelse af det Eleverne skal i 33 læste mundtligt og skriftligt makkerpar lave OL OL London 2012 Lytte aktivt

Læs mere

DanNet Fra ordbog til et leksikalsk-semantisk WordNet for dansk

DanNet Fra ordbog til et leksikalsk-semantisk WordNet for dansk DanNet Fra ordbog til et leksikalsk-semantisk WordNet for dansk Bolette Sandford Pedersen og Jørg Asmussen Kladde-version til LEDA-Nyt, oktober 2006 1 WordNet leksikalsk-semantiske ordnet for alverdens

Læs mere

CD-ORD. Værktøjet til læsning og skrivning. mikro Værkstedet

CD-ORD. Værktøjet til læsning og skrivning. mikro Værkstedet CD-ORD 8 Værktøjet til læsning og skrivning mikro Værkstedet CD-ORD CD-ORD er et personligt værktøj, der tilbyder støtte til læsning og skrivning for alle - i skolen, på jobbet, under uddannelse eller

Læs mere

Repræsentationer af handlinger og sproghandlinger

Repræsentationer af handlinger og sproghandlinger Repræsentationer af handlinger og sproghandlinger Generelt: I denne opgave omhandler pensum generelt koblingen mellem IT-systemer, som et medium hvorved brugerne af disse systemer udfører sproghandlinger.

Læs mere

DANNET ET LEKSIKALSK-SEMANTISK WORDNET FOR DANSK

DANNET ET LEKSIKALSK-SEMANTISK WORDNET FOR DANSK Peter Widell og Ulf Dalvad Berthelsen (udg.): 11. Møde om Udforskningen af Dansk Sprog Århus 2006 DANNET ET LEKSIKALSK-SEMANTISK WORDNET FOR DANSK Af Sanni Nimb (Center for Sprogteknologi, Københavns Universitet)

Læs mere

Sprogteknologi på Færøerne

Sprogteknologi på Færøerne Sprogteknologi på Færøerne Hjalmar P. Petersen, cand.mag., MA FO-360 Sandavági Færøerne ELEKTRONISKE ORDBØGER OG TEKSTER. FÆRØSK INDLEDNING Der findes ikke mange elektroniske tekster, ejheller tekstbanker,

Læs mere