Korpus 2000 til hvilken nytte? Muligheder og grænser for empiriske sprogundersøgelser

Størrelse: px
Starte visningen fra side:

Download "Korpus 2000 til hvilken nytte? Muligheder og grænser for empiriske sprogundersøgelser"

Transkript

1 Korpus 2000 til hvilken nytte? Muligheder og grænser for empiriske sprogundersøgelser JØRG ASMUSSEN Korpus 2000 er et korpus over dansk skriftsprog omkring år 2000 udarbejdet med henblik på at give alle sproginteresserede et redskab til at undersøge dansk sprogbrug med. Korpus 2000 er gjort tilgængelig på internettet parallelt med det år ældre Korpus 90, en særlig bearbejdet delmængde af Den Danske Ordbogs korpus. I bidraget skitseres først baggrunden for og opbygningen af Korpus 2000, dernæst vises en række sammenlignende sprogundersøgelser mellem Korpus 2000 og Korpus 90 og mulige konklusioner diskuteres: afspejler observerbare forskelle generelle sproglige forandringer eller bare uensartet sammensatte korpusser? På baggrund af eksemplerne opridses kort muligheder for at gøre såvel udarbejdelsen af korpusser som de undersøgelser, man kan udføre på dem, metodisk velfunderede Baggrund Korpus 2000 (K2000) blev udarbejdet af Det Danske Sprog- og Litteraturselskab i perioden Hensigten med dette projekt var at etablere en stor samling over eksempler på dansk sprogbrug et korpus 2 omkring år Dele af denne artikel, først og fremmest undersøgelseseksemplerne, er også indeholdt i Asmussen (under udgivelse), der desuden giver en mere grundig beskrivelse af de sprogstatistiske elementer i Korpus 2000-systemet, og som ellers fokuserer på undersøgelsesmetodologiske og korpuskompositoriske overvejelser og i denne forbindelse introducerer ideen om invariante tekstuelle træk (invariant textual features) som en forudsætning for korpussers diakrone sammenlignelighed. 2 Begrebet korpus bruges i betydningen meget stor digitaliseret samling af (længere uddrag af) skrevne eller nedskrevne sammenhængende autentiske, objektsproglige tekster; samlingen skal med hensyn til fastlagte teksttypologiske kriterier være struktureret efter et STU DIE R I NORDISK

2 K2000 består af tekster eller tekstuddrag fra årene og er på 28 millioner tekstord. Teksterne stammer fra et bredt udsnit af skrevet dansk, hentet fra både offentligt tilgængelige kilder som aviser, bøger, blade, radio, tv, brochurer, reklamer, tegneserier, og fra private tekster som dagbøger, breve, skolestile osv. K2000 er stillet offentligt til rådighed på internettet. 3 Parallelt med K2000 blev der udarbejdet en særlig version af Den Danske Ordbogs korpus, 4 Korpus 90 (K90), der omfatter 28 millioner tekstord skriftsprog fra perioden og dermed indeholder sprogligt materiale, som er ca år ældre end det, man finder i K2000. Målgruppen for K2000 og K90 er først og fremmest lægfolk uden større sprogvidenskabelige forudsætninger, men med interesse for sproget. Derfor er der under opbygningen af korpusserne og udviklingen af søgeinterfacet blevet lagt særlig vægt på at gøre håndteringen af hele systemet så ligetil som muligt, så det bliver lettilgængeligt for alle interesserede. Dette indebærer blandt andet, at den morfologiske og syntaktiske opmærkning af korpusserne ikke eksplicit vises, og at der i søgninger med det nuværende interface kun kan indgå ordklasseopmærkningen som et kriterium. 5 Adgang til de to korpusser får man via et fælles webbaseret søgeinterface, som blev udviklet med særlig henblik på K2000-projektet. 6 Ved hjælp af Korpus 2000's søgesystem 7 er det bl.a. muligt at søge på samtlige forekomster af et ord eller på en sekvens af ord eller ordklasser, og man kan få vist disse forekomster i forskellige oversigter. Endvidere muliggør interfacet umiddelbare sammenligninger mellem Korpus 2000 og Korpus 90. eksplicit princip med henblik på at muliggøre sprogbrugsundersøgelser, jf. Asmussen (2001) Jf. Norling-Christensen & Asmussen (1998). 5 Den morfosyntaktiske opmærkning er udført af VISL-projektet ved Syddansk Universitet, jf. Bick (2003a+b). På VISL s hjemmeside er en delmængde af K90 og K2000 søgbar med både morfologiske og syntaktiske kriterier. 6 En udførlig beskrivelse af principperne for dette interface findes i Andersen et al. (2002). 7 Som søgemaskine bruges CQP, som er udviklet ved Institut für Maschinelle Sprachverarbeitung ved universitet i Stuttgart, jf. og Christ (1994). Det webbaserede søgeinterface er udviklet hos DSL. 18 STU DIE R I NORDISK

3 I det følgende afsnit gives eksempler på en række sammenlignende undersøgelser, man kan foretage på de to korpusser, og mulige fortolkninger af resultaterne drøftes. 2. Sammenlignende undersøgelser og fortolkningen af resultater Søger man på enkeltord i K2000-systemet, vises hyppigheder og kollokater i kontrastive oversigter for K2000 og K90, der muliggør en umiddelbar sammenligning af ords udbredelse og kollokationelle egenskaber i de to korpusser. Således får brugeren straks et indtryk af de forandringer, der måtte være sket inden for ordforråd, bøjning og kombinatorik/semantik i løbet af den tid, der ligger mellem udarbejdelsen af de to korpusser. Ulempen ved den kontrastive præsentation af undersøgelsesresultater er, at brugeren let kan forledes til at drage uhensigtsmæssige slutninger, der giver et forvrænget billede af formodede sproglige forandringer Ordforråd En sammenligning af alle ords hyppigheder i K2000 og K90 viser ikke overraskende, at nogle ord forekommer betydeligt oftere i det ene korpus end i det andet. Hvis man antager, at begge korpusser afspejler deres tids danske sprogbrug, altså K90 sprogbrugen i perioden og K2000 sprogbrugen i perioden , så kan man med en vis rimelighed fortolke hyppighedsforskelle som forskelle i udbredelsen af de pågældende ord i dansk som helhed. Figur 1 nedenfor viser, hvordan hyppighederne for formerne af substantivet regn oplyses i brugerinterfacet: første søjle oplister samtlige mulige bøjningsformer af lemmaet, anden søjle oplister hver forms hyppighed i K2000 og tredje søjle de tilsvarende hyppigheder i K90. I nederste række står hyppighederne for hele lemmaet regn, dvs. summen af alle dets forskellige former. 8 Hyppighederne oplyses ikke i absolutte tal, men som logaritmiske størrelser i form af mellem 0 og 7 røde (på figuren mørke) prikker. Fordelen ved at udtrykke hyppigheden som en af otte mulige hyppighedsklasser er, at måske tilfældigt betingede forskelle i et ords hyppighed i de to korpusser udviskes til en vis grad og risikoen for at brugeren fejlfortolker hyppighedsoplysningerne følgelig mindskes noget. 8 Det glade ansigt viser, at lemmaets stavning er i overensstemmelse med Retskrivningsordbogens normering. Hyppighedstabellerne kan også indeholde former og stavemåder, der afviger fra den officielle norm de vil da være markeret med et vredt ansigt. STU DIE R I NORDISK

4 Antallet af prikker synes i øvrigt pænt at følge den intuitive fornemmelse af ords udbredelse i sproget generelt: således er ord med 1-2 prikker forholdsvis sjældne, fx entomologi, ord med 6-7 prikker er meget hyppige, fx i og og, mens ord med 3-5 prikker ligger i den store midtergruppe som fx regn. Som det fremgår af oversigten, kan der ikke konstateres de store forskelle i hyppighederne af de forskellige former af regn i de to korpusser, med én undtagelse, nemlig genitiven regns, som slet ikke forekommer i K2000, men scorer én prik i K90. Den løftede tommelfinger indikerer, at denne form forekommer mindst dobbelt så hyppigt i K90 som i K2000. Selvom tommelfingeren ikke må fortolkes som et tegn på, at der er tale om en signifikant forskel i statistisk forstand, skal den rette opmærksomheden på fænomener, som måske kunne være af lingvistisk relevans. Er man interesseret i at erfare det absolutte antal forekomster af en form på listen, klikker man på et af forstørrelsesglassene ud for formen, hvorefter man får vist en KWIC-konkordans over pågældende form sammen med det absolutte antal forekomster i det pågældende korpus: regns forekommer tre gange i K90 en forskel der nok på ingen måde berettiger til at konkludere noget om et skift i dette ords bøjningsmæssige egenskaber. Tværtimod synes regn at vurdere ud fra de logaritmiske frekvensoplysninger at være et ret stabilt udbredt ord. Figur 1. Hyppigheder for regn og former i K2000 og K90 Anderledes forholder det sig med et ord som mobiltelefon, som scorer fire prikker i K2000 mod tre i K90; faktisk er lemmaet ca. 25 gange så hyppigt i K2000 (1.586 forekomster) som i K90 (59 forekomster). Hvis man antager, at et sprogs ordforråd afspejler generelle samfundsmæssige forandringer og sammenholder dette med den teknologiske udvikling, der er sket fra midtfirserne til senhalvfemserne, er det nærliggende at fortolke den observerede kvantitative forskel som et udtryk for en faktisk ændring af det danske ordforråd: ordet mobiltelefon er blevet betydelig mere udbredt i sproget, fordi dets denotat er det. Tilsvarende eksempler er biltelefon og benchmarking: biltelefon, som er 20 STU DIE R I NORDISK

5 fem gange hyppigere i K90 (51 forekomster, 3 prikker) end i K2000 (9 forekomster, 2 prikker) betegner et apparat, som stort set er blevet erstattet af mobiltelefoner, mens benchmarking slet ikke forekommer i K90 mod 34 gange (3 prikker) i K2000, hvilket kunne tyde på at ordet er nyt i dansk. Jarvad (1999), hvis ordbog over nye ord i dansk ganske vist ikke beror på en dokumenteret empirisk, korpusstatistisk fremgangsmåde, og som derfor bør konsulteres med en vis forsigtighed, daterer første brug til 1996 hvilket muligvis støtter antagelsen, at der her er tale om et nyt låneord. De nævnte eksempler tyder på, at ændringer i udbredelsen af bestemte ord, som man kan konstatere ved at sammenligne de to korpusser, afspejler ændrede forhold i samfundet: sprog og virkelighed følges altså pænt ad, ser det ud til. Et mindre udbredt ord som kambrium forekommer fire gange (2 prikker) i K90, men findes ikke i K2000; det er desuden markeret med en løftet tommelfinger under K90. En fortolkning, analog til dem ovenfor, kunne være, at ordets udbredelse er i aftagende, måske fordi det betegner noget, som ikke længere har så stor relevans. En nærmere undersøgelse 9 af, hvilke kilder de fire forekomster i K90 stammer fra, viser at de er fra tre tekster om geologi, alle fra samme opslagsværk. 10 K2000 indeholder derimod ingen tilsvarende tekster. Noget tyder derfor på, at fagområdet geologi er dækket forskelligt i de to korpusser og at forskellen i hyppigheden for ordet kambrium siger mere om korpussernes sammensætning end om sproget som sådant. Eksemplet viser, at rå forekomsttal ikke umiddelbart bør sammenlignes, især ikke, hvis de er lave. Selvom den logaritmiske hyppighedsoplysning i K2000- systemet til en vis grad udjævner hyppighedsforskelle, der kan skyldes tilfældigheder, fejler den, når forekomstallene er lave. Målingen af ords hyppighed, forstået som indikator for deres udbredelse i sproget som helhed, bør ikke blot udtrykkes i antal forekomster eller en logaritmisk funktion heraf, men bør inddrage et mål for forekomsternes jævne fordeling over hele korpus (dispersion): et ord har givetvis en større udbredelse i sproget, hvis det bruges i flere tekster af flere forfattere over hele korpus end blot mange gange i én tekst eller tekster af én forfatter eller tekster om ét ganske snævert fagområde. 9 Denne undersøgelse kan ikke udføres direkte i K2000-systemet, da der her p.t. ikke er adgang til tekstoplysninger fra konkordanslinjer i K90. Derimod er det muligt at udføre undersøgelsen med korpussøgesystemet Semaskop på hele Den Danske Ordbogs korpus, som kan downloades fra 10 Fakta. Gyldendal STU DIE R I NORDISK

6 2.2. Bøjning Sammenligner man ikke hele lemmaer (altså summen af alle bøjningsformer), men blot bestemte bøjningsformer af en række ord, vil der ofte vise sig markante hyppighedsforskelle mellem K2000 og K90. I eksemplet regn ovenfor blev det allerede konstateret, at den indefinitte genitivform regns ikke var repræsenteret i K2000 mod tre forekomster i K90. Selvom dette ikke er statistisk signifikant, udelukker det ikke, at systemets brugere kan forledes til at drage tvivlsomme slutninger, tilskyndet både af en løftet tommelfinger og måske desuden af iagttagelsen af, at den definitte genitivform regnens absolut set også forekommer lidt sjældnere i K2000 (9 forekomster) end i K90 (12 forekomster). Elbro (2002) observerer, at visse hyppigt brugte konkrete susbstantiver udviser færre genitivformer i K2000 end i K90 og antager på baggrund heraf en tendens i dansk, hvor genitivkonstruktioner tiltagende erstattes af præpositionsforbindelser; antagelsen støttes yderligere af, at han kan konstatere forhøjede forekomsttal for en række præpositioner i K2000. Umiddelbart taler noget for denne antagelse, fx har substantivet bil i alt 393 genitivformer i K2000 mod 586 i K90 og ganske tilsvarende er resultaterne for fx cykel, hus og mand. Betragter man bil nærmere, viser det sig imidlertid, at lemmaet med alle bøjningsformer forekommer gange i K90 mod kun gange i K2000 en observation, der næppe vil få nogen til at antage i analogi med genitiv-konklusionen, at ordet bil er ved at blive erstattet af andre ord eller vendinger, eller i analogi med eksemplet biltelefon at denotatet selv er ved at forsvinde fra virkeligheden. Derfor bør man nok kun vurdere en forms kvantitative udbredelse som den (procentuelle) andel, den udgør af samtlige former af et ord. For ordet bil er andelen af genitivformer i K90 5,7% mod 4,7% i K2000 forskellen synes intuitivt for beskeden til at kunne underbygge en konklusion om markante ændringer i brugen af genitiver. Desuden underbygges en sådan konklusion ikke af en hel række andre substantiver som fx land eller Danmark. Det, der forekommer mere suspekt end mindre udsving i genitivandelene, er de markante hyppighedsforskelle for lemmaer som bil (K90: ; K2000: 8.354), land (K90: ; K2000: ) eller Danmark (K90: ; K2000: ), som kan konstateres mellem de to korpusser også selvom de logaritmiske hyppighedsangivelser for disse ord er ens for de to korpusser. Og det er snarere igen et tegn på to forskelligt sammensatte korpusser end sproglige forandringer. Eksemplerne tyder på, at man næppe kan konstatere generelle forandringer i fleksionssystemet blot ved tilfældigt at udvælge en række hyppige ord og undersøge dem, idet de kvantitative resultater, disse undersøgelser medfører, virker alt for tilfældige. Vil man undersøge sproglige forandringer, der vedrører fleksionssystemet, burde man vel snarere undersøge fænomenet i dette tilfæl- 22 STU DIE R I NORDISK

7 de altså andelen af genitivformer blandt samtlige substantiviske former i hele korpus et forhold, som Elbro i øvrigt udtrykkeligt anfører Kollokation K2000-systemet kan vise både hyppige og typiske kollokater ( naboer ) til ord. Hyppige kollokater giver oplysninger om et ords funktionelle kombinatoriske egenskaber, fx hvilke præpositioner de hyppigt optræder sammen med. Hyppige kollokater bestemmes ganske enkelt ved at tælle, hvilke ord der hyppigst optræder i den umiddelbare omgivelse af det ord, man undersøger. De otte hyppigste kollokater til venstre for lemmaet debat i K90 er eksempelvis en, i, den, til, offentlige, og, den og under. Typiske kollokater derimod bestemmes vha. en statistisk metode, mutual information, 11 og fremhæver ord, der især tiltrækkes af det undersøgte ord, men ikke i nær samme grad af det overvejende flertal af andre ord i korpus. Resultatet er et indtryk af ordets semantiske kombinatoriske egenskaber de ti mest typiske kollokater til venstre for lemmaet debat i K2000 er heftig, følelsesladet, offentlig, saglig, folkelig, livlig, konstruktiv og heftige. Kollokater vises i K2000-systemet som tabeller med fire kolonner: én for hhv. højre- og venstrekollokater for hvert af de to korpusser. Kollokaterne er sorteret i faldende orden efter antal samforekomster (hyppighed) eller efter deres mutual information score (typiskhed). Både antal samforekomster samt scoren udtrykkes ikke som absolutte talværdier, men omregnes til et antal prikker (1-5), der synes bedre egnet til at visualisere kollokaters tyngde. Figur 2 viser som eksempel de typiske kollokater for lemmaet terrorist. Figur 2. Typiske kollokater for terrorist Oversigten i figur 2 kan fortolkes på følgende måde: et af de træk ved terrorist, 11 Jf. Church&Hanks (1989) eller Church et al. (1991). I K2000-systemet er mutual information modificeret med en række filtre, der bl.a. reducerer statistisk støj, jf. Asmussen (under udgivelse). STU DIE R I NORDISK

8 som åbenbart ikke ændrer sig i løbet af det tidsrum, der ligger imellem de to korpusser, er eftersøgte og palæstinensiske, hvorimod vesttyske ikke længere synes at være et typisk træk i K2000, men derimod mange andre nationaliteter, en religiøs orientering, eller bare international. I K2000 knyttes terrorist enten til bestemte personer eller organisationer, mens dræbt (i aktiv eller passiv) er et fremherskende træk i K90. Det større antal kollokater i K2000 er et tegn på, at ordet terrorist er mere udbredt her, og det viser sig da også, at lemmaet forekommer næsten dobbelt så hyppigt i K2000 (477) som i K90 (253) hvis ikke dette bør tolkes som endnu et tegn på, at de to korpusser er sammensat forskelligt. Alligevel synes resultaterne at afspejle generelle træk ved den danske samfundsdebat om dette emne: ens historiske viden hjælper en til at forstå både ændringer og konstanter i dette ords kollokative egenskaber. For et ord som jul må man derimod antage en vis kollokativ stabilitet over en periode på kun ca. 10 år, da ordet vel overvejende bruges i stærkt traditionsbundne sammenhænge og tilsvarende finder man hovedparten af de fundne kollokater i begge korpusser, fx glædelig, fejre eller til højre for jul nytår. Det, der imidlertid kan undre en, er, at antallet af kollokater er noget større for K90 end for K2000, hvilket skyldes at jul er betydeligt hyppigere i K90 (2.196 forekomster) end i K2000 (1.275 forekomster) sandsynligvis endnu et tegn på en uensartet sammensætning af de to korpusser. Dette afspejler sig så også i, at en kollokation som hvid jul ikke dukker op i oversigten for K2000: selvom kollokationen faktisk forekommer to gange i K2000 (mod 27 i K90), er den statistisk set ikke udpræget nok til at blive udtrukket af kollokationsalgoritmen. Eksemplet viser, at tilfældige hyppighedsforskelle i et ellers ret udbredt ord, kan have en afgørende indflydelse på statistisk fremfinding af stadig gyldige kollokationer. Eksemplet viser også, at en sammenligning af kollokater bestemt på baggrund af et ord, hvis hyppighed er markant forskellig i de to korpusser, ikke nødvendigvis giver et realistisk indtryk af ændringer i dets kollokative egenskaber: selvom et ord faktisk bruges mindre, betyder det jo ikke, at dets kollokative egenskaber har ændret sig af den grund, men dets ellers veletablerede kollokater kan ikke nødvendigvis længere bestemmes vha. en statistisk kollokabilitetsanalyse. Modsat vil den statistiske kollokabilitetsanalyse i visse tilfælde udpege ord, som intuitivt ikke kan betragtes som kollokater til et ord. Udfører man en kollokabilitetsanalyse på juletræ, får man som ventet bl.a. pynte og danse (rundt om), men i K2000 får man som det mest markante venstrekollokat talende! En nærmere undersøgelse af konkordansen med de konkrete forekomster af talende juletræ viser, at de alle stammer fra en og samme tekst. 12 Eksemplet viser, at de 12 En julehistorie fra fyldepennen.dk. 24 STU DIE R I NORDISK

9 rene forekomsttal, et ord har i hele korpus, heller ikke bør lægges umiddelbart til grund for kollokabilitetsberegningen også her burde man i virkeligheden operere med en dispersionsbaseret korrektion, der ville kunne undertrykke ad hoc-kollokationer som talende juletræ, som alene skyldes én speciel tekst i korpus Semantik Nært beslægtet med kollokation er mange ords tendens til at indgå i helt bestemte kontekstuelt betingede semantiske sammenhæng, eksempelvis vil man typisk finde sund fornuft, næppe syg fornuft, mens bivirkning sjældent vil blive kendetegnet som uskadelig, men ofte som skadelig et semantisk fænomen, som bl.a. Rundell (2002) betegner som semantisk prosodi. 13 Mange leksemer indgår således i en ganske bestemt semantisk kontekst, der restringerer deres semantiske kombinatoriske egenskaber. Ordet sideeffekt, 14 som har 11 forekomster i K90 og 22 i K2000, er sandsynligvis et relativt nyt låneord fra engelsk, om end ikke registreret i Jarvad (1999). Da betydningen af engelsk side effect kan ækvivaleres med den, bivirkning har på dansk, kan man argumentere, at sideeffekt vel egentlig er overflødig på dansk. Omtrent halvdelen af forekomsterne af sideeffekt i K90 viser ordet i en tydelig negativ kontekst, der afslører, at sideeffekt er noget utilsigtet skadeligt, og ordet indgår i semantiske kontekster, der er ganske parallelle med dem for bivirkning. I K2000 er billedet derimod et noget andet: ordet bruges stadigvæk om noget utilsigtet, men nu positivt, egentlig vel svarende til betydningen af sidegevinst en del af forekomsterne modificeret af adjektivet positiv, jf. figur 3. Figur 3. Semantisk prosodi for sideeffekt 13 Rundell (2002) betragter fænomenet som en særlig leksikografisk udfordring, idet det ofte kun vanskeligt lader sig beskrive i ordbøger, samtidig med at det kan være af afgørende betydning for acceptabel sprogbrug. 14 Forfatteren blev gjort opmærksom på dette eksempel af Henrik Gottlieb, Engelsk Institut, KU. STU DIE R I NORDISK

10 Spørgsmålet er nu, hvorvidt sideeffekt-eksemplerne fra K90 og K2000 empirisk kan støtte konklusionen, at sideeffekt faktisk har ændret dets semantisk-prosodiske egenskaber fra de oprindelige engelske til en mere selvstændig dansk positiv bivirkning, og dermed måske har fundet en semantisk niche i dansk. Hvor mange eksempler på et ords måske ændrede semantik har man brug for, før man med sikkerhed kan udelukke korpuskompositionel støj og kan fremsætte generelle udsagn om bestemte semantiske forandringer i et sprog som helhed? 2.5. Ordtopologi Der skal gives ét eksempel på sammenlignende ordtopologiske undersøgelser for at illustrere de metodiske problemer, der knytter sig hertil. Almindeligvis betragtes hovedsætningsordstilling af ikke i bisætninger som substandard som fx i? Anne serverer kaffe, fordi Peter drikker ikke te. Det skal undersøges, hvor udbredt denne konstruktion, der måske især forekommer i talesprog, er i de to skriftsproglige korpusser. Intuitivt eller måske også ud fra en antagelse om, at talesproget determinerer skriftsproget skulle man forvente, at den ikkekanoniske placering af ikke i bisætninger er mere udbredt i K2000 end i K90. Om end en tilbundsgående undersøgelse med det eksisterende søgesystem ikke umiddelbart er mulig, viser undersøgelser af bestemte ordtopologiske mønstre, fx en søgning på sekvensen at-pronomen-verbum-ikke, at den ikke-kanoniske placering af ikke er mere udbredt i K90 end i K2000 figur 4 viser en række eksempler. Figur 4. Eksempler fra K90 på ikke-kanonisk placering af ikke 3. Korpus 2000 til hvilken nytte? Eksemplerne ovenfor viser, at sammenlignende korpusundersøgelser i en række tilfælde kan medføre tvivlsomme fortolkninger og generaliseringer vedrørende sproglige forandringer og man må derfor spørge, hvad man dog skal med et korpus, der ganske vist påstås at kunne bruges til empiriske sprogundersøgelser, 26 STU DIE R I NORDISK

11 der dog så alligevel er præget af tilfældigheder og unøjagtigheder i en grad, så man er henvist til sin egen sproglige intuition, når man skal vurdere undersøgelsesresultaterne. Problemet er dog næppe brugen af et korpus som sådan, men snarere de metoder, man lægger til grund for korpusbaserede undersøgelser i almindelighed og for sammenlignende undersøgelser i særdeleshed. En grundlæggende metodisk vanskelighed ved korpusbaserede sprogundersøgelser er muligheden for at kvantificere sproglige fænomener, mens traditionelle sprogundersøgelser ofte tager udgangspunkt i en kvalitativ beskrivelse af et bestemt sprogligt fænomen, som man måske tilfældigt er stødt på. Undersøgelsens fokus forskydes altså i korpusbaserede undersøgelser let fra en beskrivelse af hvad man ser, til en beskrivelse af, hvor meget man ser hvor idealet måske burde være en kombination: både beskrivelsen af et fænomen og dets måske skiftende udbredelse. Hertil kommer, at de forekomsttal, man umiddelbart ser ved sammenligningen af to korpusser, ikke nødvendigvis er sammenlignelige. I den fysiske verden er det for de fleste evident, at én kilometer er mere end ti kilometer, men om én kilometer er meget eller lidt, afhænger også af den kontekst, hvori mængedeangivelsen bliver brugt. Ti kilometer kan således være en ganske betragtelig vejlængde, hvis den skal tilbagelægges til fods, mens den samme vejlængde tilbagelagt i bil er knapt så imponerende. Ganske tilsvarende gælder for de forekomsttal, man finder i et korpus: de giver ingen mening i sig selv, men kun i forhold til noget andet, indenfor en kontekst det er således ganske intetsigende, at konstatere at mand har genitivformer i K90 mod i K2000, når man ikke i det mindste sætter disse tal i forhold til, hvor mange forekomster lemmaet mand har i de to korpusser: gør man det, finder man, at andelen af genitivformer for lemmaet mand er 2,0% i begge korpusser. Med andre ord kan forekomsttal aldrig tages for pålydende i korpusundersøgelser, og for hver type undersøgelse kræves der en række metodiske overvejelser, inden man giver sig til at konkludere. Som K2000's søgesystem er opbygget nu, får brugeren i virkeligheden ikke megen metodisk hjælp det overlades i vid udstrækning til brugeren selv at fortolke de kvantitative resultater hensigtsmæssigt. Så selvom sigtet med K2000's webbaserede søgesystem var, at gøre det let for enhver sproginteresseret af lave sine egene sproglige undersøgelser, bidrager grænsefladen ikke til at minimere metodiske fejlgreb en ulempe, som fremtidige versioner af grænsefladen bør råde bod på. Hertil kommer så spørgsmålet, hvad sammenlignelighed af korpusser egentlig vil sige. K90's og K2000's sammensætning er tilstræbt identiske, men i praksis, dvs. i de viste eksempler, er der noget, der tyder på, at sammensætningen ikke kan være så identisk endda. Det gælder først og fremmest forskelle i udbredelsen af bestemte lemmaer, som man intuitivt skulle mene havde en STU DIE R I NORDISK

12 konstant udbredelse i sproget inden for en tidsramme af ca. 10 år, fx bil, jul, mand osv. Og ganske rigtigt er det især andelen af avismateriale i de to korpusser, som er meget forskelligt, ca. en tredjedel i K90 mod to tredjedele i K2000. Dette rejser spørgsmålet, hvordan man sikrer sammenlignelighed af to korpusser mht. til en bestemt dimension, i dette tilfælde tidsdimensionen: hvordan burde et K90 og et K2000 sammensættes, så man kunne være sikker på, at de forskelle, man kan konstatere imellem dem, vitterligt er sikre indicier på tidsbestemte sproglige forandringer? Løsningen på de skitserede problemstillinger må findes i udviklingen af en generel metodologi for korpusdesign og -udnyttelse et område, som Det Danske Sprog- og Litteraturselskab trods beskedne resurser arbejder indenfor med henblik på at kunne forbedre kvaliteten både af de eksisterende korpusser og af de søgesystemer, der knytter sig til dem. Målet for 2004 er at kunne lancere et forbedret webinterface for K2000, hvori der vil være taget højde for en hel række af de søgemetodiske problemstillinger, som blev skitseret i dette bidrag. Litteratur Andersen, M.S., Asmussen, H., Asmussen, J. (2002): The Project of Korpus 2000 Going Public; in: A. Braasch and C. Povlsen (eds.): Proceedings of the Tenth EURALEX International Congress, EURALEX 2002, København. Asmussen, J. (2001): Korpus Et overblik over projektets baggrund, fremgangsmåder og perspektiver. NyS 30. Nydanske studier & almen kommunikationsteori, København. Asmussen, J. (under udgivelse): Towards a methodology for corpus-based studies of linguistic change. Contrastive observations and their possible diachronic interpretations in the Korpus 2000 and Korpus 90 Corpora of Danish; in: Archer, Rayson, Wilson (eds.): Corpus Linguistics Around the World. Rodopi, Amsterdam. Bick, E. (2003a): Morfosyntaktisk opmærkede corpora for dansk: Korpus 90/2000 og Arboretum; in: 9. Møde om Udforskningen af Dansk Sprog oktober Proceedings. Aarhus Universitet. Bick, E. (2003b): A CG & PSG hybrid approach to automatic corpus annotation; in: Simov, K. & Osenova P. (eds.): Proceedings of the Workshop on Shallow Processing of Large Corpora (SProLaC 2003) held in conjunction with the Corpus Linguistics 2003 Conference. UCREL technical paper no. 17. UCREL, Lancaster University. 28 STU DIE R I NORDISK

13 Christ, O. (1994): A modular and flexible architecture for an integrated corpus query system. COMPLEX 94 Proceedings, Budapest. Church, K. & P. Hanks (1989): Word association norms, mutual information and lexicography. ACL Proceedings, 27 th Annual Meeting, Vancouver. Church, K. et al. (1991): Using Statistics in Lexical Analysis; in: Zernik (ed.): Lexical Acquisition. Exploiting On-Line Resources to Build a Lexicon. Hillsdale, New Jersey Elbro, C. (2002): Ift, ifm, mht, mhp og andre uspecifikke præpositioner. Mål og Mæle 3:2002, København, pp Jarvad, P. (1999): Nye Ord. Ordbog over nye ord i dansk København. Norling-Christensen, O. & J. Asmussen (1998): The Corpus of The Danish Dictionary; in: Lexikos 8, Afrilex Series 8:1998, Stellenbosch, pp Rundell, M. (2002): Good Old-fashioned Lexicography: Human Judgment and the Limits of Automation; in M-H. Corréard (ed.): Lexicography and Natural Language Processing. A Festschrift in Honour of B.T.S. Atkins. EURALEX STU DIE R I NORDISK

sproget.dk en internetportal for det danske sprog

sproget.dk en internetportal for det danske sprog sproget.dk en internetportal for det danske sprog Ida Elisabeth Mørch, Dansk Sprognævn Lars Trap-Jensen, Det Danske Sprog- og Litteratuselskab 1 Baggrunden 2003 Sprog på spil 2005 Ekstrabevilling 2006

Læs mere

Prosodi i ledsætninger

Prosodi i ledsætninger Eksamensopgave 2 Dansk talesprog: Prosodi og syntaks Prosodi i ledsætninger Ruben Schachtenhaufen Indledning I denne opgave vil jeg undersøge nogle forhold vedrørende prosodi og syntaks i ledsætninger

Læs mere

Rita Lenstrup. Kritiske bemærkninger til artikel af Henning Bergenholtz, Helle Dam og Torben Henriksen i Hermes 5 l990, side

Rita Lenstrup. Kritiske bemærkninger til artikel af Henning Bergenholtz, Helle Dam og Torben Henriksen i Hermes 5 l990, side Rita Lenstrup 109 Kritiske bemærkninger til artikel af Henning Bergenholtz, Helle Dam og Torben Henriksen i Hermes 5 l990, side 127-136. 1. Indledning I Hermes nr. 5 præsenteredes en sammenlignende vurdering

Læs mere

It-støttet excerpering og registrering af nye ord og ordforbindelser

It-støttet excerpering og registrering af nye ord og ordforbindelser It-støttet excerpering og registrering af nye ord og ordforbindelser Møde i Selskab for Nordisk Filologi 30. oktober 2008 Jakob Halskov Projektforsker, ph.d. Dansk Sprognævn jhalskov@dsn.dk Disposition

Læs mere

Korpusbaseret lemmaselektion og opdatering

Korpusbaseret lemmaselektion og opdatering Korpusbaseret lemmaselektion og opdatering Jørg Asmussen Afdeling for Digitale Ordbøger og Tekstkorpora Det Danske Sprog- og Litteraturselskab www.dsl.dk Program 1. Introduktion til DSL 2. Introduktion

Læs mere

Hovedresultater af DREAMs befolkningsfremskrivning

Hovedresultater af DREAMs befolkningsfremskrivning Hovedresultater af DREAMs 26- befolkningsfremskrivning 3. juni 26 Marianne Frank Hansen & Lars Haagen Pedersen Udviklingen i den samlede befolkning Danmarks befolkning er vokset fra 2,4 mio. personer i

Læs mere

CorpusEye - Et brugervenligt web-interface for grammatisk opmærkede korpora

CorpusEye - Et brugervenligt web-interface for grammatisk opmærkede korpora Peter Widell og Mette Kunøe (udg.): 10. Møde om Udforskningen af Dansk Sprog Århus 2004 CorpusEye - Et brugervenligt web-interface for grammatisk opmærkede korpora Af Eckhard Bick (Syddansk Universitet)

Læs mere

a. Find ud af mere om sprogteknologi på internettet. Hvad er nogle typiske anvendelser? Hvor mange af dem bruger du i din hverdag?

a. Find ud af mere om sprogteknologi på internettet. Hvad er nogle typiske anvendelser? Hvor mange af dem bruger du i din hverdag? En computer forstår umiddelbart ikke de sprog vi mennesker taler og skriver. Inden for sprogteknologien (på engelsk: Natural Language Processing eller NLP), der er en gren af kunstig intelligens, beskæftiger

Læs mere

Intro til design og brug af korpora

Intro til design og brug af korpora Intro til design og brug af korpora Jørg Asmussen ja@dsl.dk Det Danske Sprog- og Litteraturselskab www.dsl.dk Intro til design og brug korpuslingvistik af korpora Jørg Asmussen ja@dsl.dk Det Danske Sprog-

Læs mere

Kvantitative metoder inden for korpuslingvistiske projekter

Kvantitative metoder inden for korpuslingvistiske projekter Kvantitative metoder inden for korpuslingvistiske projekter Illustreret ved eksempler fra Den Danske Ordbogs korpus, Korpus 2000 og Korpus 90 Jørg Asmussen Det Danske Sprog- og Litteraturselskab, DSL ja@dsl.dk

Læs mere

Fremstillingsformer i historie

Fremstillingsformer i historie Fremstillingsformer i historie DET BESKRIVENDE NIVEAU Et referat er en kortfattet, neutral og loyal gengivelse af tekstens væsentligste indhold. Du skal vise, at du kan skelne væsentligt fra uvæsentligt

Læs mere

Hvad sker der med sin i moderne dansk og hvorfor sker det? Af Torben Juel Jensen

Hvad sker der med sin i moderne dansk og hvorfor sker det? Af Torben Juel Jensen Hvad sker der med sin i moderne dansk og hvorfor sker det? Af Torben Juel Jensen De fleste danskere behøver bare at høre en sætning som han tog sin hat og gik sin vej, før de er klar over hvilken sprogligt

Læs mere

RESUME TRANSLATION MEMORY-SYSTEMER SOM VÆRKTØJ TIL JURIDISK OVERSÆTTELSE. KRITISK VURDERING AF ANVENDELIGHEDEN AF TRANSLATION MEMORY-SYSTEMER TIL

RESUME TRANSLATION MEMORY-SYSTEMER SOM VÆRKTØJ TIL JURIDISK OVERSÆTTELSE. KRITISK VURDERING AF ANVENDELIGHEDEN AF TRANSLATION MEMORY-SYSTEMER TIL RESUME TRANSLATION MEMORY-SYSTEMER SOM VÆRKTØJ TIL JURIDISK OVERSÆTTELSE. KRITISK VURDERING AF ANVENDELIGHEDEN AF TRANSLATION MEMORY-SYSTEMER TIL OVERSÆTTELSE AF SELSKABSRETLIG DOKUMENTATION. I den foreliggende

Læs mere

2.7. HVAD BETYDER DET EGENTLIG AT BETEGNE SIG SELV SOM TROENDE?

2.7. HVAD BETYDER DET EGENTLIG AT BETEGNE SIG SELV SOM TROENDE? 2.7. HVAD BETYDER DET EGENTLIG AT BETEGNE SIG SELV SOM TROENDE? Abstract: Danmark har i de seneste 50-60 år været igennem dramatiske forandringer på en række samfundsområder inklusive det religiøse. Disse

Læs mere

Det islandske ordklasseopmærkede korpus MÍM Sigrún Helgadóttir

Det islandske ordklasseopmærkede korpus MÍM Sigrún Helgadóttir Det islandske ordklasseopmærkede korpus MÍM Sigrún Helgadóttir Det islandske ordklasseopmærkede korpus Oversigt over foredraget: Hvor stammer projektet fra? Hvad er et ordklasseopmærket korpus? Hvordan

Læs mere

Svensk model for bibliometri i et norsk og dansk perspektiv

Svensk model for bibliometri i et norsk og dansk perspektiv Notat Svensk model for bibliometri i et norsk og dansk perspektiv 1. Indledning og sammenfatning I Sverige har Statens Offentlige Udredninger netop offentliggjort et forslag til en kvalitetsfinansieringsmodel

Læs mere

Undersøgelse af det faglige indgangsniveau

Undersøgelse af det faglige indgangsniveau Undersøgelse af det faglige indgangsniveau 74 pct. af undervisere på første studieår på 11 udvalgte uddannelser vurderer, at nye studerende har et tilstrækkeligt indgangsniveau. Over de seneste 20 år er

Læs mere

Analyseinstitut for Forskning

Analyseinstitut for Forskning Analyseinstitut for Forskning Folk og forskning Forskningsformidling - Danskernes kilder til viden om forskning Notat 2001/2 ISSN: 1399-8897 Analyseinstitut for Forskning/ The Danish Institute for Studies

Læs mere

Fuldstændig fantastisk?

Fuldstændig fantastisk? Fuldstændig fantastisk? Holger Juul, lektor, ph.d., Center for Læseforskning, Københavns Universitet Enten-eller vs. både-og I marts-nummeret af Nyt om Ordblindhed tager Erik Arendal afstand fra det han

Læs mere

Skolevægring. Resultater fra en spørgeskemaundersøgelse blandt skoleledere på danske folkeskoler og specialskoler

Skolevægring. Resultater fra en spørgeskemaundersøgelse blandt skoleledere på danske folkeskoler og specialskoler Skolevægring Resultater fra en spørgeskemaundersøgelse blandt skoleledere på danske folkeskoler og specialskoler Udarbejdet af Analyse & Tal for Institut for Menneskerettigheder juli 017 Indledning Udsendelse

Læs mere

Spørgsmål om ophavsret den islandske erfaring

Spørgsmål om ophavsret den islandske erfaring Spørgsmål om ophavsret den islandske erfaring Sigrún Helgadóttir Árni Magnússon instituttet for islandske studier Leksikografisk afdeling Spåkteknologisk infrastruktur Nordiskt seminarium vid Wallenberg

Læs mere

Karrierekvinder og -mænd

Karrierekvinder og -mænd Rockwool Fondens Forskningsenhed Arbejdspapir 35 Karrierekvinder og -mænd Hvem er de? Og hvor travlt har de? Jens Bonke København 2015 Karrierekvinder og -mænd Hvem er de? Og hvor travlt har de? Arbejdspapir

Læs mere

DiaSketching og afterminologisering hvornår er en term en term? Nordterm 2005 9. - 12. juni 2005 Reykjavik, Island

DiaSketching og afterminologisering hvornår er en term en term? Nordterm 2005 9. - 12. juni 2005 Reykjavik, Island DiaSketching og afterminologisering hvornår er en term en term? Nordterm 2005 9. - 12. juni 2005 Reykjavik, Island Jakob Halskov (jh.id@cbs.dk) Dept. of Computational Linguistics Copenhagen Business School

Læs mere

At måle og veje korpusser et aspekt af arbejdet bag de store almensproglige korpusser for dansk

At måle og veje korpusser et aspekt af arbejdet bag de store almensproglige korpusser for dansk At måle og veje korpusser et aspekt af arbejdet bag de store almensproglige korpusser for dansk Jørg Asmussen Det Danske Sprog- og Litteraturselskab www.dsl.dk Bidrag til Bente Maegaard-festskrift KLADDE-VERSION

Læs mere

Risikofaktorudviklingen i Danmark fremskrevet til 2020

Risikofaktorudviklingen i Danmark fremskrevet til 2020 23. marts 9 Arbejdsnotat Risikofaktorudviklingen i Danmark fremskrevet til Udarbejdet af Knud Juel og Michael Davidsen Baseret på data fra Sundheds- og sygelighedsundersøgelserne er der ud fra køns- og

Læs mere

Delma l for Danish. Det talte sprog. Måltaksonomi: Beginners Middlegroup Advanced Efter Y4 Forstå enkle ord og vendinger knyttet til dagligdagen

Delma l for Danish. Det talte sprog. Måltaksonomi: Beginners Middlegroup Advanced Efter Y4 Forstå enkle ord og vendinger knyttet til dagligdagen Delma l for Danish Det talte Måltaksonomi: Beginners Middlegroup Advanced Efter Y4 Forstå enkle ord og vendinger knyttet til dagligdagen Fortælle hvad man har oplevet Fremlægge, fortælle, forklare og interviewe

Læs mere

Faglige delmål og slutmål i faget Dansk. Trin 1

Faglige delmål og slutmål i faget Dansk. Trin 1 Faglige delmål og slutmål i faget Dansk. Trin 1 Undervisningen skal lede frem mod, at eleverne i 1. klasse har tilegnet sig kundskaber og Det talte sprog Undervisningen tager udgangspunkt i elevernes sproglige

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Sådan bruger du Den Danske Regnskabsordbog

Sådan bruger du Den Danske Regnskabsordbog Sådan bruger du Den Danske Regnskabsordbog Visning Når du får et søgeresultat, kan du gøre skriften større eller mindre ved at klikke på knapperne yderst til højre på skærmen: større, mindre, nulstil.

Læs mere

Bedømmelsesvejledning til prøven i skriftlig fremstilling D, december Dansk som andetsprog

Bedømmelsesvejledning til prøven i skriftlig fremstilling D, december Dansk som andetsprog Bedømmelsesvejledning til prøven i skriftlig fremstilling D, december 2016 Dansk som andetsprog Information om prøven i skriftlig fremstilling D Prøven i skriftlig fremstilling D består af et teksthæfte,

Læs mere

Turismeerhvervets forventninger til 2011 og 2012

Turismeerhvervets forventninger til 2011 og 2012 Økonomisk analyse fra HORESTA oktober 2011 Turismeerhvervets forventninger til 2011 og 2012 Om analysen HORESTA Viden & Udvikling har i maj/juni 2011 gennemført en omfattende undersøgelse blandt medlemsvirksomhederne

Læs mere

Læring af test. Rapport for. Aarhus Analyse Skoleåret

Læring af test. Rapport for. Aarhus Analyse  Skoleåret Læring af test Rapport for Skoleåret 2016 2017 Aarhus Analyse www.aarhus-analyse.dk Introduktion Skoleledere har adgang til masser af data på deres elever. Udfordringen er derfor ikke at skaffe adgang

Læs mere

Syv veje til kærligheden

Syv veje til kærligheden Syv veje til kærligheden Pouline Middleton 1. udgave, 1. oplag 2014 Fiction Works Aps Omslagsfoto: Fotograf Steen Larsen ISBN 9788799662999 Alle rettigheder forbeholdes. Enhver form for kommerciel gengivelse

Læs mere

Vidensmedier på nettet

Vidensmedier på nettet Vidensmedier på nettet En sociokulturel forståelse af læring kan bringe os til at se bibliotekernes samlinger som læringsressourcer og til at rette blikket mod anvendelsespotentialerne. fra Aarhus Universitet

Læs mere

Faglig læsning i matematik

Faglig læsning i matematik Faglig læsning i matematik af Heidi Kristiansen 1.1 Faglig læsning en matematisk arbejdsmåde Der har i de senere år været sat megen fokus på, at danske elever skal blive bedre til at læse. Tidligere har

Læs mere

FØDEVARESTYRELSEN KUNDETILFREDSHEDSUNDERSØGELSE

FØDEVARESTYRELSEN KUNDETILFREDSHEDSUNDERSØGELSE FØDEVARESTYRELSEN KUNDETILFREDSHEDSUNDERSØGELSE August 2013 1 Om undersøgelsen Læsevejledning til rapporten. Advice A/S har på vegne af Fødevarestyrelsen gennemført en måling af tilfredsheden hos styrelsens

Læs mere

Danskerne, islam og muslimer Af professor Peter Nannestad, Institut for Statskundskab, Aarhus Universitet

Danskerne, islam og muslimer Af professor Peter Nannestad, Institut for Statskundskab, Aarhus Universitet Danskerne, islam og muslimer Af professor Peter Nannestad, Institut for Statskundskab, Aarhus Universitet Siden terrorangrebet den 11. september 2001 og Muhammed-krisen i 2005 er spørgsmålet om danskernes

Læs mere

Skolen påvirker hele familien

Skolen påvirker hele familien JANUAR 2019 NYT FRA RFF Skolen påvirker hele familien N år et barns skolestart udskydes, har det konsekvenser - ikke kun for barnet selv, men også for forældrene og for barnets ældre søskende. Det viser

Læs mere

Sprogteknologiske resourcer for islandsk leksikografi

Sprogteknologiske resourcer for islandsk leksikografi Eiríkur Rögnvaldsson Sprogteknologiske resourcer for islandsk leksikografi Seminar om leksikografi og sprogteknologi Schæffergården 31. januar 2010 Foredragets emne Islandsk sprogteknologi omkring århundredskiftet

Læs mere

Kommunikative færdigheder Undervisningen skal lede frem mod, at eleverne har tilegnet sig kundskaber og færdigheder, der sætter dem i stand til at

Kommunikative færdigheder Undervisningen skal lede frem mod, at eleverne har tilegnet sig kundskaber og færdigheder, der sætter dem i stand til at ODENSE FRISKOLE Fagplan for Engelsk Formål Formålet med undervisningen i engelsk er, at eleverne tilegner sig kundskaber og færdigheder, således at de kan forstå talt og skrevet engelsk og kan udtrykke

Læs mere

Læsevejledning til resultater på regions- og sygehusplan

Læsevejledning til resultater på regions- og sygehusplan Læsevejledning til resultater på regions- og sygehusplan Indhold 1. Overblik...2 2. Sammenligninger...2 3. Hvad viser figuren?...3 4. Hvad viser tabellerne?...6 6. Eksempler på typiske spørgsmål til tabellerne...9

Læs mere

Nordjysk Konjunkturbarometer RESUMÉ 1. KVARTAL 2000

Nordjysk Konjunkturbarometer RESUMÉ 1. KVARTAL 2000 Konjunkturanalysegruppen Institut for Erhvervsstudier, Aalborg Universitet Jesper Lindgaard Christensen Bent Dalum Lars Gelsing Carsten Stig Poulsen Nordjysk Konjunkturbarometer RESUMÉ 1. KVARTAL 1. Baggrund

Læs mere

Solidaritet, risikovillighed og partnerskønhed

Solidaritet, risikovillighed og partnerskønhed Rockwool Fondens Forskningsenhed Arbejdspapir 36 Solidaritet, risikovillighed og partnerskønhed Jens Bonke København 1 Solidaritet, risikovillighed og partnerskønhed Arbejdspapir 36 Udgivet af: Rockwool

Læs mere

Socialtilsynets inddragelse af oplysninger fra borgerne i det driftsorienterede

Socialtilsynets inddragelse af oplysninger fra borgerne i det driftsorienterede Socialtilsynets inddragelse af oplysninger fra borgerne i det driftsorienterede tilsyn Udgivet af Socialstyrelsen September 2017 Publikationen er udgivet af Socialstyrelsen Edisonsvej 18, 1. 5000 Odense

Læs mere

Kriminalitet og alder

Kriminalitet og alder JUSTITSMINISTERIETS FORSKNINGSKONTOR NOVEMBER 2015 Kriminalitet og alder Udviklingen i strafferetlige afgørelser 2005-2014 Dette notat angår udviklingen i den registrerede kriminalitet i de seneste ti

Læs mere

Manuskriptvejledning De Studerendes Pris

Manuskriptvejledning De Studerendes Pris Fremsendelse af artikel Artikler skrevet på baggrund af bachelorprojekter, der er afleveret og bestået i det annoncerede tidsrum, kan deltage i konkurrencen om De Studerendes Pris. Det er kun muligt at

Læs mere

Erhvervslivet imod tvungen adskillelse af revision og rådgivning

Erhvervslivet imod tvungen adskillelse af revision og rådgivning Erhvervslivet imod tvungen adskillelse af revision og rådgivning Det diskuteres i øjeblikket at ændre reglerne for revisorer for at skabe en større adskillelse imellem revisor og kunder. Et forslag er

Læs mere

Korpus 2000 m.fl. Jørg Asmussen, Det Danske Sprog- og Litteraturselskab, DSL. 24. april Korpus / 47

Korpus 2000 m.fl. Jørg Asmussen, Det Danske Sprog- og Litteraturselskab, DSL. 24. april Korpus / 47 Korpus 2000 mfl Jørg Asmussen, Det Danske Sprog- og Litteraturselskab, DSL 24 april 2006 Korpus 2000 1 / 47 Overblik ODS Den Danske Ordbog Korpus 2000 Flere korpora Søgeværktøjer Det Danske Sprog- og Litteraturselskab:

Læs mere

Analyse 10. juni 2015

Analyse 10. juni 2015 Analyse 1. juni 21 Hvad har valgkampen handlet om indtil videre? Af Nicolai Kaarsen I november 214 tilkendegav danskerne, at emner som arbejdsløshed, indvandring og beskyttelse af miljøet var blandt de

Læs mere

Problem 1: Trykbevidsthed

Problem 1: Trykbevidsthed Page 1 of 5 04/20/09 - Sammen satte ord - fra et fonetisk perspektiv Retskrivningsordbogen har en enkelt regel hvor skrivemåden gøres afhængig af udtalen. Det drejer om 18? om hvorvidt en ordforbindelse

Læs mere

Censorvejledning for censorer i skriftlig fransk begyndersprog og fortsættersprog A, hhx. Analog prøve

Censorvejledning for censorer i skriftlig fransk begyndersprog og fortsættersprog A, hhx. Analog prøve Maj 2018 Censorvejledning for censorer i skriftlig fransk begyndersprog og fortsættersprog A, hhx Analog prøve Den skriftlige eksamen i fransk er først og fremmest en sproglig prøve, som skal give eksaminanderne

Læs mere

Madkulturen - Madindeks 2015 81. Idealer om det gode aftensmåltid

Madkulturen - Madindeks 2015 81. Idealer om det gode aftensmåltid Madkulturen - Madindeks 2015 81 5. Idealer om det gode aftensmåltid 82 Madkulturen - Madindeks 2015 5. Idealer om det gode aftensmåltid Madkultur handler både om, hvad danskerne spiser, men også om hvilke

Læs mere

På alle områder er konklusionen klar: Der er en statistisk sammenhæng mellem forældre og børns forhold.

På alle områder er konklusionen klar: Der er en statistisk sammenhæng mellem forældre og børns forhold. Social arv 163 8. Social arv nes sociale forhold nedarves til deres børn Seks områder undersøges Der er en klar tendens til, at forældrenes sociale forhold "nedarves" til deres børn. Det betyder bl.a.,

Læs mere

Læseundersøgelse blandt unge i målgruppe for forberedende grunduddannelse (FGU)

Læseundersøgelse blandt unge i målgruppe for forberedende grunduddannelse (FGU) Læseundersøgelse blandt unge i målgruppe for forberedende grunduddannelse (FGU) Anna Steenberg Gellert og Carsten Elbro, Center for Læseforskning, Københavns Universitet Baggrund På den nyligt oprettede

Læs mere

temaanalyse 2000-2009

temaanalyse 2000-2009 temaanalyse DRÆBTE I Norden -29 DATO: December 211 FOTO: Vejdirektoratet ISBN NR: 97887766554 (netversion) COPYRIGHT: Vejdirektoratet, 211 2 dræbte i norden -29 Dette notat handler om ulykker med dræbte

Læs mere

At konstruere et socialt rum. Annick Prieur og Lennart Rosenlund

At konstruere et socialt rum. Annick Prieur og Lennart Rosenlund At konstruere et socialt rum Annick Prieur og Lennart Rosenlund Vort sigte Vise hvorledes vi er gået frem, når vi har konstrueret et socialt rum ud fra surveydata fra en dansk by Aalborg efter de samme

Læs mere

Skole og Samfunds spørgeskemaundersøgelse 2008 -Elevplaner og kvalitetsrapporter

Skole og Samfunds spørgeskemaundersøgelse 2008 -Elevplaner og kvalitetsrapporter Skole og Samfunds spørgeskemaundersøgelse 2008 -Elevplaner og kvalitetsrapporter Sammenfatning Forældrene er glade for elevplanerne 70 % af skolebestyrelsesmedlemmerne i Skole og Samfunds undersøgelse

Læs mere

Semantiske relationer og begrebssystemer

Semantiske relationer og begrebssystemer Semantiske relationer og begrebssystemer I denne opgave vil jeg beskæftige mig med semantiske relationer og begrebssystemer med udgangspunkt i en oplysende tekst fra Politikens Vinbog (se bilag). Jeg vil

Læs mere

Analyseinstitut for Forskning

Analyseinstitut for Forskning Analyseinstitut for Forskning Bioteknologi Opfattelser og holdninger blandt danskere, 1989-2000 Notat 2001/3 ISSN: 1399-8897 Analyseinstitut for Forskning/ The Danish Institute for Studies in Research

Læs mere

Statistik viden eller tilfældighed

Statistik viden eller tilfældighed MATEMATIK i perspektiv Side 1 af 9 DNA-analyser 1 Sandsynligheden for at en uskyldig anklages Følgende histogram viser, hvordan fragmentlængden for et DNA-område varierer inden for befolkningen. Der indgår

Læs mere

Brugerundersøgelse Lægemiddelkorpus

Brugerundersøgelse Lægemiddelkorpus 1 Brugerundersøgelse Lægemiddelkorpus Vi føler, at vi med Korpus-redskabet har fået et løft i forbindelse med vores oversættelsesarbejde både kvalitets- og tidsmæssigt (lægemiddelvirksomhed) Oversættelsesredskabet

Læs mere

Har I totalt rygeforbud på virksomhedens matrikel (altså såvel indenfor som udenfor)? 76%

Har I totalt rygeforbud på virksomhedens matrikel (altså såvel indenfor som udenfor)? 76% Notat Rygning i erhvervslivet Til: Dansk Erhverv Fra: MJC/MMM Rygning bliver stadig mindre udbredt blandt danskerne, og mange steder er det ikke længere tilladt at ryge. Dansk Erhverv har i juni 2014 undersøgt,

Læs mere

Stigende utilfredshed med jobcentrene i Danmark

Stigende utilfredshed med jobcentrene i Danmark ANALYSE Stigende utilfredshed med jobcentrene i Danmark Resumé De danske virksomheder oplever i disse år en mangel på arbejdskraft, som ikke er oplevet magen siden dagene før finanskrisen i slutningen

Læs mere

Metoder og struktur ved skriftligt arbejde i idræt.

Metoder og struktur ved skriftligt arbejde i idræt. Metoder og struktur ved skriftligt arbejde i idræt. Kort gennemgang omkring opgaver: Som udgangspunkt skal du når du skriver opgaver i idræt bygge den op med udgangspunkt i de taksonomiske niveauer. Dvs.

Læs mere

AARHUS KOMMUNE BRUGERTILFREDSHEDSUNDERSØGELSE 2017 BOSTØTTE, BOFÆLLESSKABER OG BOTILBUD I VOKSENHANDICAP

AARHUS KOMMUNE BRUGERTILFREDSHEDSUNDERSØGELSE 2017 BOSTØTTE, BOFÆLLESSKABER OG BOTILBUD I VOKSENHANDICAP AARHUS KOMMUNE BRUGERTILFREDSHEDSUNDERSØGELSE 2017 BOSTØTTE, BOFÆLLESSKABER OG BOTILBUD I VOKSENHANDICAP INDHOLD Afsnit 01 Introduktion Side 03 Afsnit 02 Læsevejledning Side 05 Afsnit 03 Sammenfatning

Læs mere

SILKEBORG KOMMUNE FORÆLDRETILFREDSHEDSUNDERSØGELSE 2018 SKOLE OG SFO

SILKEBORG KOMMUNE FORÆLDRETILFREDSHEDSUNDERSØGELSE 2018 SKOLE OG SFO SILKEBORG KOMMUNE FORÆLDRETILFREDSHEDSUNDERSØGELSE 2018 SKOLE OG SFO 1 INDHOLD Afsnit 01 Introduktion Side 03 Afsnit 02 Sammenfatning Side 05 Afsnit 03 Skoleresultater Side 07 Afsnit 04 SFO-resultater

Læs mere

Brugervejledning til Højkvalitetsdokumentationen og Dialogforummet på Danmarks Statistiks hjemmeside

Brugervejledning til Højkvalitetsdokumentationen og Dialogforummet på Danmarks Statistiks hjemmeside Brugervejledning til Højkvalitetsdokumentationen og Dialogforummet på Danmarks Statistiks hjemmeside Forord Denne vejledning beskriver baggrunden for begreber og sammenhænge i Danmarks Statistiks dokumentationssystem

Læs mere

JUSTITSMINISTERIETS FORSKNINGSKONTOR NOVEMBER 2017

JUSTITSMINISTERIETS FORSKNINGSKONTOR NOVEMBER 2017 JUSTITSMINISTERIETS FORSKNINGSKONTOR NOVEMBER 2017 UDVIKLINGEN I ANTAL ANMELDELSER OG I STRAFFENES ART OG LÆNGDE FOR VOLD, 2007-2016 På baggrund af Danmarks Statistiks tal vedrørende anmeldelser og strafferetlige

Læs mere

4. Snittets kædebrøksfremstilling og dets konvergenter

4. Snittets kædebrøksfremstilling og dets konvergenter Dette er den fjerde af fem artikler under den fælles overskrift Studier på grundlag af programmet SKALAGENERATOREN (forfatter: Jørgen Erichsen) 4. Snittets kædebrøksfremstilling og dets konvergenter Vi

Læs mere

BONUSINFORMATIONER i forbindelse med emnet Billeder og grafik

BONUSINFORMATIONER i forbindelse med emnet Billeder og grafik BONUSINFORMATIONER i forbindelse med emnet Billeder og grafik Dette dokument indeholder yderligere informationer, tips og råd angående: Tabelfunktionen SmartArtfunktionen Billedfunktionen Samt en ekstra

Læs mere

Rapport 23. november 2018

Rapport 23. november 2018 Rapport 23. november 2018 Proj.nr. 2004280 Version 1 EVO/MT Principper for og forslag til repræsentative stikprøveplaner til analyse af konsekvensen af produktionsændringer for værdi- og kvalitetsvurdering

Læs mere

EVALUERING AF BOLIGSOCIALE AKTIVITETER

EVALUERING AF BOLIGSOCIALE AKTIVITETER Guide EVALUERING AF BOLIGSOCIALE AKTIVITETER Det er rart at vide, om en aktivitet virker. Derfor følger der ofte et ønske om evaluering med, når I iværksætter nye aktiviteter. Denne guide er en hjælp til

Læs mere

Om brugen af farvebetegnelser i dansk på internettet

Om brugen af farvebetegnelser i dansk på internettet Om brugen af farvebetegnelser i dansk på internettet Esben Alfort Brugen af farvetermer i dansk, som det skrives på internettet, viser, at bestemte farver kan modificeres eller sammensættes for en mere

Læs mere

Metoder og erkendelsesteori

Metoder og erkendelsesteori Metoder og erkendelsesteori Af Ole Bjerg Inden for folkesundhedsvidenskabelig forskning finder vi to forskellige metodiske tilgange: det kvantitative og det kvalitative. Ser vi på disse, kan vi konstatere

Læs mere

Samarbejdet mellem forvaltning og skoleledelse

Samarbejdet mellem forvaltning og skoleledelse Samarbejdet mellem forvaltning og skoleledelse En undersøgelse af samarbejdet om elevernes læring og trivsel på tværs af landets kommuner Fakta og spørgsmål til refleksion SKOLE Indhold 3 Hvorfor denne

Læs mere

Kriminalitet og alder

Kriminalitet og alder JUSTITSMINISTERIETS FORSKNINGSKONTOR SEPTEMBER 2014 Kriminalitet og alder Udviklingen i strafferetlige afgørelser 2004-2013 Dette notat angår udviklingen i den registrerede kriminalitet i de seneste ti

Læs mere

SAMMENFATNING RESUME AF UDREDNINGEN ARBEJDSLIVSKVALITET OG MODERNE ARBEJDSLIV

SAMMENFATNING RESUME AF UDREDNINGEN ARBEJDSLIVSKVALITET OG MODERNE ARBEJDSLIV SAMMENFATNING RESUME AF UDREDNINGEN ARBEJDSLIVSKVALITET OG MODERNE ARBEJDSLIV Af Stine Jacobsen, Helle Holt, Pia Bramming og Henrik Holt Larsen RESUME AF UDREDNINGEN ARBEJDSLIVSKVALITET OG MODERNE ARBEJDSLIV

Læs mere

Produktsøgning. Eniro Krak. Tabelrapport. Oktober 2014

Produktsøgning. Eniro Krak. Tabelrapport. Oktober 2014 Eniro Krak Produktsøgning Tabelrapport Oktober 2014 Materialet er fortroligt og må ikke anvendes uden for klientens organisation uden forudgående skriftligt samtykke fra Radius Kommunikation A/S Indhold

Læs mere

Undervisningen skal samtidig udvikle elevernes bevidsthed om engelsk sprog og sprogbrug samt om sprogtilegnelse.

Undervisningen skal samtidig udvikle elevernes bevidsthed om engelsk sprog og sprogbrug samt om sprogtilegnelse. HAUBRO FRISKOLE Fagplan for Engelsk Formål Formålet med undervisningen i engelsk er, at eleverne tilegner sig kundskaber og færdigheder, således at de kan forstå talt og skrevet engelsk og kan udtrykke

Læs mere

Nordjysk Konjunkturbarometer RESUMÉ 4. KVARTAL 2000

Nordjysk Konjunkturbarometer RESUMÉ 4. KVARTAL 2000 Konjunkturanalysegruppen Institut for Erhvervsstudier, Aalborg Universitet Jesper Lindgaard Christensen Bent Dalum Morten Berg Jensen Carsten Stig Poulsen Nordjysk Konjunkturbarometer RESUMÉ 4. KVARTAL

Læs mere

Små virksomheders andel af offentlige

Små virksomheders andel af offentlige VELFUNGERENDE MARKEDER NR 26 19 Små virksomheders andel af offentlige I artiklen fremlægges nye data, som belyser små virksomheders andel af de offentlige opgaver, som sendes i EU-udbud. Analysen viser

Læs mere

Komparativt syn på Danmarks og Norges mikrofinans sektor

Komparativt syn på Danmarks og Norges mikrofinans sektor Konklusion Komparativt syn på s og s mikrofinans sektor For både den danske og norske sektor gør de samme tendenser sig gældende, nemlig: 1. Private virksomheders engagement i mikrofinans har været stigende.

Læs mere

Senere skolestart har ingen effekt på uddannelsesniveau

Senere skolestart har ingen effekt på uddannelsesniveau Nyt fra November 2015 Senere skolestart har ingen effekt på uddannelsesniveau Børn, der startede et år senere i skole, klarer sig ikke bedre end børn, der startede skole rettidigt, når der måles på færdiggjort

Læs mere

Forslag til principielle ændringer af dansk retskrivning til offentliggørelse i Retskrivningsordbogen 2012.

Forslag til principielle ændringer af dansk retskrivning til offentliggørelse i Retskrivningsordbogen 2012. Kulturminister Per Stig Møller Nybrogade 2 1203 Kbh. K Udkast til brev. Forslag til principielle ændringer af dansk retskrivning til offentliggørelse i Retskrivningsordbogen 2012. Med henvisning til Lov

Læs mere

Hans Hansen STANDARD RAPPORT. Adaptive General Reasoning Test

Hans Hansen STANDARD RAPPORT. Adaptive General Reasoning Test Adaptive General Reasoning Test STANDARD RAPPORT Dette er en fortrolig rapport, som udelukkende må anvendes af personer med en gyldig certificering i anvendelse af værktøjet AdaptGRT fra DISCOVER A/S.

Læs mere

Flere unge har brug for fleksuddannelse?

Flere unge har brug for fleksuddannelse? Flere unge har brug for fleksuddannelse? Knap hver femte ung f i dag ikke en ungdomsuddannelse. Det betyder, at der fra hver gang er ca. 11.000 unge, som har brug for et andet tilbud end de eksisterende

Læs mere

ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T B l e g d a m s v e j 3 B 2 2 0 0 K ø b e n h a v n N ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER

Læs mere

En sammenligning af driftsomkostningerne i den almene og private udlejningssektor

En sammenligning af driftsomkostningerne i den almene og private udlejningssektor En sammenligning af driftsomkostningerne i den almene og private udlejningssektor bl danmarks almene boliger 1 1. Indledning og sammenfatning En analyse af driftsomkostningerne i hhv. den almene og private

Læs mere

VisiRegn: En e-bro mellem regning og algebra

VisiRegn: En e-bro mellem regning og algebra Artikel i Matematik nr. 2 marts 2001 VisiRegn: En e-bro mellem regning og algebra Inge B. Larsen Siden midten af 80 erne har vi i INFA-projektet arbejdet med at udvikle regne(arks)programmer til skolens

Læs mere

Analyse. Kontanthjælpsreformen har fået flere unge i uddannelse eller beskæftigelse men forbliver de der? 29. april 2015

Analyse. Kontanthjælpsreformen har fået flere unge i uddannelse eller beskæftigelse men forbliver de der? 29. april 2015 Analyse 29. april 215 Kontanthjælpsreformen har fået flere unge i uddannelse eller beskæftigelse men forbliver de der? Af Kristian Thor Jakobsen og Katrine Marie Tofthøj Kontanthjælpsreformen, der blev

Læs mere

Undervisningsplan for engelsk

Undervisningsplan for engelsk Undervisningsplan for engelsk Formål: Formålet med undervisningen i engelsk er, at eleverne tilegner sig kundskaber og færdigheder, således at de kan forstå talt og skrevet engelsk og kan og tør udtrykke

Læs mere

Det Røde Hav og de fire fokusøer Lærervejledning

Det Røde Hav og de fire fokusøer Lærervejledning Det Røde Hav og de fire fokusøer Lærervejledning Asymmetrisk tænkning - det vi plejer at gøre Assymmetrisk tænkning er den tænkning, som oftest bruges, når en gruppe af personer skal blive enige om noget.

Læs mere

Demografiske udfordringer frem til 2040

Demografiske udfordringer frem til 2040 Demografiske udfordringer frem til 2040 Af Niels Henning Bjørn, NIHB@kl.dk Danmarks befolkning vokser i disse år som følge af længere levetid, store årgange og indvandring. Det har især betydningen for

Læs mere

Oplevet mobildækning. Publikationen kan hentes på: www.erst.dk

Oplevet mobildækning. Publikationen kan hentes på: www.erst.dk Oplevet mobildækning Publikationen kan hentes på: www.erst.dk Maj 2013 Indholdsfortegnelse SIDE Forord 3 Hovedresultater 4 Ingen dækning 6 Delvis dækning 7 Opkaldsfejl pr. selskab 8 Opkaldsfejl pr. telefon

Læs mere

Madkulturen - Madindeks 2015 69. Rammer for danskernes måltider

Madkulturen - Madindeks 2015 69. Rammer for danskernes måltider Madkulturen - Madindeks 2015 69 4. Rammer for danskernes måltider 70 Madkulturen - Madindeks 2015 4. Rammer for danskernes måltider Dette kapitel handler om rammerne for danskernes måltider hvem de spiser

Læs mere

Evaluering af Soltimer

Evaluering af Soltimer DANMARKS METEOROLOGISKE INSTITUT TEKNISK RAPPORT 01-16 Evaluering af Soltimer Maja Kjørup Nielsen Juni 2001 København 2001 ISSN 0906-897X (Online 1399-1388) Indholdsfortegnelse Indledning... 1 Beregning

Læs mere

Tietgenskolen - Nørrehus. Data warehouse. Database for udviklere. Thor Harloff Lynggaard DM08125

Tietgenskolen - Nørrehus. Data warehouse. Database for udviklere. Thor Harloff Lynggaard DM08125 Tietgenskolen - Nørrehus Data warehouse Database for udviklere Thor Harloff Lynggaard DM08125 Juni 2010 Indhold Beskrivelse... 3 Data warehouse... 3 Generelt... 3 Sammenligning... 3 Gode sider ved DW...

Læs mere

Analyseinstitut for Forskning

Analyseinstitut for Forskning Analyseinstitut for Forskning Den danske brugerundersøgelse i forbindelse med en eventuel etablering af selvstændig Nordisk Forskningsstatistik Notat 2003/2 Analyseinstitut for Forskning The Danish Institute

Læs mere

THOMAS KAAS (UCC & AU, DPU), WEBINAR, 31. JANUAR, 2018

THOMAS KAAS (UCC & AU, DPU), WEBINAR, 31. JANUAR, 2018 THOMAS KAAS (UCC & AU, DPU), WEBINAR, 31. JANUAR, 2018 Hvad er algebra i grundskolen, og hvorfor er det svært? Hvad er tidlig algebra, og hvorfor skulle det hjælpe? Undervisning med tidlig algebra hvad

Læs mere

Børn, unge og alkohol 1997-2002

Børn, unge og alkohol 1997-2002 Børn, unge og alkohol 1997-22 Indledning 3 I. Alder for børn og unges alkoholdebut (kun 22) 4 II. Har man nogensinde været fuld? III. Drukket alkohol den seneste måned 6 IV. Drukket fem eller flere genstande

Læs mere