Korpus 2000 til hvilken nytte? Muligheder og grænser for empiriske sprogundersøgelser
|
|
- August Thøgersen
- 8 år siden
- Visninger:
Transkript
1 Korpus 2000 til hvilken nytte? Muligheder og grænser for empiriske sprogundersøgelser JØRG ASMUSSEN Korpus 2000 er et korpus over dansk skriftsprog omkring år 2000 udarbejdet med henblik på at give alle sproginteresserede et redskab til at undersøge dansk sprogbrug med. Korpus 2000 er gjort tilgængelig på internettet parallelt med det år ældre Korpus 90, en særlig bearbejdet delmængde af Den Danske Ordbogs korpus. I bidraget skitseres først baggrunden for og opbygningen af Korpus 2000, dernæst vises en række sammenlignende sprogundersøgelser mellem Korpus 2000 og Korpus 90 og mulige konklusioner diskuteres: afspejler observerbare forskelle generelle sproglige forandringer eller bare uensartet sammensatte korpusser? På baggrund af eksemplerne opridses kort muligheder for at gøre såvel udarbejdelsen af korpusser som de undersøgelser, man kan udføre på dem, metodisk velfunderede Baggrund Korpus 2000 (K2000) blev udarbejdet af Det Danske Sprog- og Litteraturselskab i perioden Hensigten med dette projekt var at etablere en stor samling over eksempler på dansk sprogbrug et korpus 2 omkring år Dele af denne artikel, først og fremmest undersøgelseseksemplerne, er også indeholdt i Asmussen (under udgivelse), der desuden giver en mere grundig beskrivelse af de sprogstatistiske elementer i Korpus 2000-systemet, og som ellers fokuserer på undersøgelsesmetodologiske og korpuskompositoriske overvejelser og i denne forbindelse introducerer ideen om invariante tekstuelle træk (invariant textual features) som en forudsætning for korpussers diakrone sammenlignelighed. 2 Begrebet korpus bruges i betydningen meget stor digitaliseret samling af (længere uddrag af) skrevne eller nedskrevne sammenhængende autentiske, objektsproglige tekster; samlingen skal med hensyn til fastlagte teksttypologiske kriterier være struktureret efter et STU DIE R I NORDISK
2 K2000 består af tekster eller tekstuddrag fra årene og er på 28 millioner tekstord. Teksterne stammer fra et bredt udsnit af skrevet dansk, hentet fra både offentligt tilgængelige kilder som aviser, bøger, blade, radio, tv, brochurer, reklamer, tegneserier, og fra private tekster som dagbøger, breve, skolestile osv. K2000 er stillet offentligt til rådighed på internettet. 3 Parallelt med K2000 blev der udarbejdet en særlig version af Den Danske Ordbogs korpus, 4 Korpus 90 (K90), der omfatter 28 millioner tekstord skriftsprog fra perioden og dermed indeholder sprogligt materiale, som er ca år ældre end det, man finder i K2000. Målgruppen for K2000 og K90 er først og fremmest lægfolk uden større sprogvidenskabelige forudsætninger, men med interesse for sproget. Derfor er der under opbygningen af korpusserne og udviklingen af søgeinterfacet blevet lagt særlig vægt på at gøre håndteringen af hele systemet så ligetil som muligt, så det bliver lettilgængeligt for alle interesserede. Dette indebærer blandt andet, at den morfologiske og syntaktiske opmærkning af korpusserne ikke eksplicit vises, og at der i søgninger med det nuværende interface kun kan indgå ordklasseopmærkningen som et kriterium. 5 Adgang til de to korpusser får man via et fælles webbaseret søgeinterface, som blev udviklet med særlig henblik på K2000-projektet. 6 Ved hjælp af Korpus 2000's søgesystem 7 er det bl.a. muligt at søge på samtlige forekomster af et ord eller på en sekvens af ord eller ordklasser, og man kan få vist disse forekomster i forskellige oversigter. Endvidere muliggør interfacet umiddelbare sammenligninger mellem Korpus 2000 og Korpus 90. eksplicit princip med henblik på at muliggøre sprogbrugsundersøgelser, jf. Asmussen (2001) Jf. Norling-Christensen & Asmussen (1998). 5 Den morfosyntaktiske opmærkning er udført af VISL-projektet ved Syddansk Universitet, jf. Bick (2003a+b). På VISL s hjemmeside er en delmængde af K90 og K2000 søgbar med både morfologiske og syntaktiske kriterier. 6 En udførlig beskrivelse af principperne for dette interface findes i Andersen et al. (2002). 7 Som søgemaskine bruges CQP, som er udviklet ved Institut für Maschinelle Sprachverarbeitung ved universitet i Stuttgart, jf. og Christ (1994). Det webbaserede søgeinterface er udviklet hos DSL. 18 STU DIE R I NORDISK
3 I det følgende afsnit gives eksempler på en række sammenlignende undersøgelser, man kan foretage på de to korpusser, og mulige fortolkninger af resultaterne drøftes. 2. Sammenlignende undersøgelser og fortolkningen af resultater Søger man på enkeltord i K2000-systemet, vises hyppigheder og kollokater i kontrastive oversigter for K2000 og K90, der muliggør en umiddelbar sammenligning af ords udbredelse og kollokationelle egenskaber i de to korpusser. Således får brugeren straks et indtryk af de forandringer, der måtte være sket inden for ordforråd, bøjning og kombinatorik/semantik i løbet af den tid, der ligger mellem udarbejdelsen af de to korpusser. Ulempen ved den kontrastive præsentation af undersøgelsesresultater er, at brugeren let kan forledes til at drage uhensigtsmæssige slutninger, der giver et forvrænget billede af formodede sproglige forandringer Ordforråd En sammenligning af alle ords hyppigheder i K2000 og K90 viser ikke overraskende, at nogle ord forekommer betydeligt oftere i det ene korpus end i det andet. Hvis man antager, at begge korpusser afspejler deres tids danske sprogbrug, altså K90 sprogbrugen i perioden og K2000 sprogbrugen i perioden , så kan man med en vis rimelighed fortolke hyppighedsforskelle som forskelle i udbredelsen af de pågældende ord i dansk som helhed. Figur 1 nedenfor viser, hvordan hyppighederne for formerne af substantivet regn oplyses i brugerinterfacet: første søjle oplister samtlige mulige bøjningsformer af lemmaet, anden søjle oplister hver forms hyppighed i K2000 og tredje søjle de tilsvarende hyppigheder i K90. I nederste række står hyppighederne for hele lemmaet regn, dvs. summen af alle dets forskellige former. 8 Hyppighederne oplyses ikke i absolutte tal, men som logaritmiske størrelser i form af mellem 0 og 7 røde (på figuren mørke) prikker. Fordelen ved at udtrykke hyppigheden som en af otte mulige hyppighedsklasser er, at måske tilfældigt betingede forskelle i et ords hyppighed i de to korpusser udviskes til en vis grad og risikoen for at brugeren fejlfortolker hyppighedsoplysningerne følgelig mindskes noget. 8 Det glade ansigt viser, at lemmaets stavning er i overensstemmelse med Retskrivningsordbogens normering. Hyppighedstabellerne kan også indeholde former og stavemåder, der afviger fra den officielle norm de vil da være markeret med et vredt ansigt. STU DIE R I NORDISK
4 Antallet af prikker synes i øvrigt pænt at følge den intuitive fornemmelse af ords udbredelse i sproget generelt: således er ord med 1-2 prikker forholdsvis sjældne, fx entomologi, ord med 6-7 prikker er meget hyppige, fx i og og, mens ord med 3-5 prikker ligger i den store midtergruppe som fx regn. Som det fremgår af oversigten, kan der ikke konstateres de store forskelle i hyppighederne af de forskellige former af regn i de to korpusser, med én undtagelse, nemlig genitiven regns, som slet ikke forekommer i K2000, men scorer én prik i K90. Den løftede tommelfinger indikerer, at denne form forekommer mindst dobbelt så hyppigt i K90 som i K2000. Selvom tommelfingeren ikke må fortolkes som et tegn på, at der er tale om en signifikant forskel i statistisk forstand, skal den rette opmærksomheden på fænomener, som måske kunne være af lingvistisk relevans. Er man interesseret i at erfare det absolutte antal forekomster af en form på listen, klikker man på et af forstørrelsesglassene ud for formen, hvorefter man får vist en KWIC-konkordans over pågældende form sammen med det absolutte antal forekomster i det pågældende korpus: regns forekommer tre gange i K90 en forskel der nok på ingen måde berettiger til at konkludere noget om et skift i dette ords bøjningsmæssige egenskaber. Tværtimod synes regn at vurdere ud fra de logaritmiske frekvensoplysninger at være et ret stabilt udbredt ord. Figur 1. Hyppigheder for regn og former i K2000 og K90 Anderledes forholder det sig med et ord som mobiltelefon, som scorer fire prikker i K2000 mod tre i K90; faktisk er lemmaet ca. 25 gange så hyppigt i K2000 (1.586 forekomster) som i K90 (59 forekomster). Hvis man antager, at et sprogs ordforråd afspejler generelle samfundsmæssige forandringer og sammenholder dette med den teknologiske udvikling, der er sket fra midtfirserne til senhalvfemserne, er det nærliggende at fortolke den observerede kvantitative forskel som et udtryk for en faktisk ændring af det danske ordforråd: ordet mobiltelefon er blevet betydelig mere udbredt i sproget, fordi dets denotat er det. Tilsvarende eksempler er biltelefon og benchmarking: biltelefon, som er 20 STU DIE R I NORDISK
5 fem gange hyppigere i K90 (51 forekomster, 3 prikker) end i K2000 (9 forekomster, 2 prikker) betegner et apparat, som stort set er blevet erstattet af mobiltelefoner, mens benchmarking slet ikke forekommer i K90 mod 34 gange (3 prikker) i K2000, hvilket kunne tyde på at ordet er nyt i dansk. Jarvad (1999), hvis ordbog over nye ord i dansk ganske vist ikke beror på en dokumenteret empirisk, korpusstatistisk fremgangsmåde, og som derfor bør konsulteres med en vis forsigtighed, daterer første brug til 1996 hvilket muligvis støtter antagelsen, at der her er tale om et nyt låneord. De nævnte eksempler tyder på, at ændringer i udbredelsen af bestemte ord, som man kan konstatere ved at sammenligne de to korpusser, afspejler ændrede forhold i samfundet: sprog og virkelighed følges altså pænt ad, ser det ud til. Et mindre udbredt ord som kambrium forekommer fire gange (2 prikker) i K90, men findes ikke i K2000; det er desuden markeret med en løftet tommelfinger under K90. En fortolkning, analog til dem ovenfor, kunne være, at ordets udbredelse er i aftagende, måske fordi det betegner noget, som ikke længere har så stor relevans. En nærmere undersøgelse 9 af, hvilke kilder de fire forekomster i K90 stammer fra, viser at de er fra tre tekster om geologi, alle fra samme opslagsværk. 10 K2000 indeholder derimod ingen tilsvarende tekster. Noget tyder derfor på, at fagområdet geologi er dækket forskelligt i de to korpusser og at forskellen i hyppigheden for ordet kambrium siger mere om korpussernes sammensætning end om sproget som sådant. Eksemplet viser, at rå forekomsttal ikke umiddelbart bør sammenlignes, især ikke, hvis de er lave. Selvom den logaritmiske hyppighedsoplysning i K2000- systemet til en vis grad udjævner hyppighedsforskelle, der kan skyldes tilfældigheder, fejler den, når forekomstallene er lave. Målingen af ords hyppighed, forstået som indikator for deres udbredelse i sproget som helhed, bør ikke blot udtrykkes i antal forekomster eller en logaritmisk funktion heraf, men bør inddrage et mål for forekomsternes jævne fordeling over hele korpus (dispersion): et ord har givetvis en større udbredelse i sproget, hvis det bruges i flere tekster af flere forfattere over hele korpus end blot mange gange i én tekst eller tekster af én forfatter eller tekster om ét ganske snævert fagområde. 9 Denne undersøgelse kan ikke udføres direkte i K2000-systemet, da der her p.t. ikke er adgang til tekstoplysninger fra konkordanslinjer i K90. Derimod er det muligt at udføre undersøgelsen med korpussøgesystemet Semaskop på hele Den Danske Ordbogs korpus, som kan downloades fra 10 Fakta. Gyldendal STU DIE R I NORDISK
6 2.2. Bøjning Sammenligner man ikke hele lemmaer (altså summen af alle bøjningsformer), men blot bestemte bøjningsformer af en række ord, vil der ofte vise sig markante hyppighedsforskelle mellem K2000 og K90. I eksemplet regn ovenfor blev det allerede konstateret, at den indefinitte genitivform regns ikke var repræsenteret i K2000 mod tre forekomster i K90. Selvom dette ikke er statistisk signifikant, udelukker det ikke, at systemets brugere kan forledes til at drage tvivlsomme slutninger, tilskyndet både af en løftet tommelfinger og måske desuden af iagttagelsen af, at den definitte genitivform regnens absolut set også forekommer lidt sjældnere i K2000 (9 forekomster) end i K90 (12 forekomster). Elbro (2002) observerer, at visse hyppigt brugte konkrete susbstantiver udviser færre genitivformer i K2000 end i K90 og antager på baggrund heraf en tendens i dansk, hvor genitivkonstruktioner tiltagende erstattes af præpositionsforbindelser; antagelsen støttes yderligere af, at han kan konstatere forhøjede forekomsttal for en række præpositioner i K2000. Umiddelbart taler noget for denne antagelse, fx har substantivet bil i alt 393 genitivformer i K2000 mod 586 i K90 og ganske tilsvarende er resultaterne for fx cykel, hus og mand. Betragter man bil nærmere, viser det sig imidlertid, at lemmaet med alle bøjningsformer forekommer gange i K90 mod kun gange i K2000 en observation, der næppe vil få nogen til at antage i analogi med genitiv-konklusionen, at ordet bil er ved at blive erstattet af andre ord eller vendinger, eller i analogi med eksemplet biltelefon at denotatet selv er ved at forsvinde fra virkeligheden. Derfor bør man nok kun vurdere en forms kvantitative udbredelse som den (procentuelle) andel, den udgør af samtlige former af et ord. For ordet bil er andelen af genitivformer i K90 5,7% mod 4,7% i K2000 forskellen synes intuitivt for beskeden til at kunne underbygge en konklusion om markante ændringer i brugen af genitiver. Desuden underbygges en sådan konklusion ikke af en hel række andre substantiver som fx land eller Danmark. Det, der forekommer mere suspekt end mindre udsving i genitivandelene, er de markante hyppighedsforskelle for lemmaer som bil (K90: ; K2000: 8.354), land (K90: ; K2000: ) eller Danmark (K90: ; K2000: ), som kan konstateres mellem de to korpusser også selvom de logaritmiske hyppighedsangivelser for disse ord er ens for de to korpusser. Og det er snarere igen et tegn på to forskelligt sammensatte korpusser end sproglige forandringer. Eksemplerne tyder på, at man næppe kan konstatere generelle forandringer i fleksionssystemet blot ved tilfældigt at udvælge en række hyppige ord og undersøge dem, idet de kvantitative resultater, disse undersøgelser medfører, virker alt for tilfældige. Vil man undersøge sproglige forandringer, der vedrører fleksionssystemet, burde man vel snarere undersøge fænomenet i dette tilfæl- 22 STU DIE R I NORDISK
7 de altså andelen af genitivformer blandt samtlige substantiviske former i hele korpus et forhold, som Elbro i øvrigt udtrykkeligt anfører Kollokation K2000-systemet kan vise både hyppige og typiske kollokater ( naboer ) til ord. Hyppige kollokater giver oplysninger om et ords funktionelle kombinatoriske egenskaber, fx hvilke præpositioner de hyppigt optræder sammen med. Hyppige kollokater bestemmes ganske enkelt ved at tælle, hvilke ord der hyppigst optræder i den umiddelbare omgivelse af det ord, man undersøger. De otte hyppigste kollokater til venstre for lemmaet debat i K90 er eksempelvis en, i, den, til, offentlige, og, den og under. Typiske kollokater derimod bestemmes vha. en statistisk metode, mutual information, 11 og fremhæver ord, der især tiltrækkes af det undersøgte ord, men ikke i nær samme grad af det overvejende flertal af andre ord i korpus. Resultatet er et indtryk af ordets semantiske kombinatoriske egenskaber de ti mest typiske kollokater til venstre for lemmaet debat i K2000 er heftig, følelsesladet, offentlig, saglig, folkelig, livlig, konstruktiv og heftige. Kollokater vises i K2000-systemet som tabeller med fire kolonner: én for hhv. højre- og venstrekollokater for hvert af de to korpusser. Kollokaterne er sorteret i faldende orden efter antal samforekomster (hyppighed) eller efter deres mutual information score (typiskhed). Både antal samforekomster samt scoren udtrykkes ikke som absolutte talværdier, men omregnes til et antal prikker (1-5), der synes bedre egnet til at visualisere kollokaters tyngde. Figur 2 viser som eksempel de typiske kollokater for lemmaet terrorist. Figur 2. Typiske kollokater for terrorist Oversigten i figur 2 kan fortolkes på følgende måde: et af de træk ved terrorist, 11 Jf. Church&Hanks (1989) eller Church et al. (1991). I K2000-systemet er mutual information modificeret med en række filtre, der bl.a. reducerer statistisk støj, jf. Asmussen (under udgivelse). STU DIE R I NORDISK
8 som åbenbart ikke ændrer sig i løbet af det tidsrum, der ligger imellem de to korpusser, er eftersøgte og palæstinensiske, hvorimod vesttyske ikke længere synes at være et typisk træk i K2000, men derimod mange andre nationaliteter, en religiøs orientering, eller bare international. I K2000 knyttes terrorist enten til bestemte personer eller organisationer, mens dræbt (i aktiv eller passiv) er et fremherskende træk i K90. Det større antal kollokater i K2000 er et tegn på, at ordet terrorist er mere udbredt her, og det viser sig da også, at lemmaet forekommer næsten dobbelt så hyppigt i K2000 (477) som i K90 (253) hvis ikke dette bør tolkes som endnu et tegn på, at de to korpusser er sammensat forskelligt. Alligevel synes resultaterne at afspejle generelle træk ved den danske samfundsdebat om dette emne: ens historiske viden hjælper en til at forstå både ændringer og konstanter i dette ords kollokative egenskaber. For et ord som jul må man derimod antage en vis kollokativ stabilitet over en periode på kun ca. 10 år, da ordet vel overvejende bruges i stærkt traditionsbundne sammenhænge og tilsvarende finder man hovedparten af de fundne kollokater i begge korpusser, fx glædelig, fejre eller til højre for jul nytår. Det, der imidlertid kan undre en, er, at antallet af kollokater er noget større for K90 end for K2000, hvilket skyldes at jul er betydeligt hyppigere i K90 (2.196 forekomster) end i K2000 (1.275 forekomster) sandsynligvis endnu et tegn på en uensartet sammensætning af de to korpusser. Dette afspejler sig så også i, at en kollokation som hvid jul ikke dukker op i oversigten for K2000: selvom kollokationen faktisk forekommer to gange i K2000 (mod 27 i K90), er den statistisk set ikke udpræget nok til at blive udtrukket af kollokationsalgoritmen. Eksemplet viser, at tilfældige hyppighedsforskelle i et ellers ret udbredt ord, kan have en afgørende indflydelse på statistisk fremfinding af stadig gyldige kollokationer. Eksemplet viser også, at en sammenligning af kollokater bestemt på baggrund af et ord, hvis hyppighed er markant forskellig i de to korpusser, ikke nødvendigvis giver et realistisk indtryk af ændringer i dets kollokative egenskaber: selvom et ord faktisk bruges mindre, betyder det jo ikke, at dets kollokative egenskaber har ændret sig af den grund, men dets ellers veletablerede kollokater kan ikke nødvendigvis længere bestemmes vha. en statistisk kollokabilitetsanalyse. Modsat vil den statistiske kollokabilitetsanalyse i visse tilfælde udpege ord, som intuitivt ikke kan betragtes som kollokater til et ord. Udfører man en kollokabilitetsanalyse på juletræ, får man som ventet bl.a. pynte og danse (rundt om), men i K2000 får man som det mest markante venstrekollokat talende! En nærmere undersøgelse af konkordansen med de konkrete forekomster af talende juletræ viser, at de alle stammer fra en og samme tekst. 12 Eksemplet viser, at de 12 En julehistorie fra fyldepennen.dk. 24 STU DIE R I NORDISK
9 rene forekomsttal, et ord har i hele korpus, heller ikke bør lægges umiddelbart til grund for kollokabilitetsberegningen også her burde man i virkeligheden operere med en dispersionsbaseret korrektion, der ville kunne undertrykke ad hoc-kollokationer som talende juletræ, som alene skyldes én speciel tekst i korpus Semantik Nært beslægtet med kollokation er mange ords tendens til at indgå i helt bestemte kontekstuelt betingede semantiske sammenhæng, eksempelvis vil man typisk finde sund fornuft, næppe syg fornuft, mens bivirkning sjældent vil blive kendetegnet som uskadelig, men ofte som skadelig et semantisk fænomen, som bl.a. Rundell (2002) betegner som semantisk prosodi. 13 Mange leksemer indgår således i en ganske bestemt semantisk kontekst, der restringerer deres semantiske kombinatoriske egenskaber. Ordet sideeffekt, 14 som har 11 forekomster i K90 og 22 i K2000, er sandsynligvis et relativt nyt låneord fra engelsk, om end ikke registreret i Jarvad (1999). Da betydningen af engelsk side effect kan ækvivaleres med den, bivirkning har på dansk, kan man argumentere, at sideeffekt vel egentlig er overflødig på dansk. Omtrent halvdelen af forekomsterne af sideeffekt i K90 viser ordet i en tydelig negativ kontekst, der afslører, at sideeffekt er noget utilsigtet skadeligt, og ordet indgår i semantiske kontekster, der er ganske parallelle med dem for bivirkning. I K2000 er billedet derimod et noget andet: ordet bruges stadigvæk om noget utilsigtet, men nu positivt, egentlig vel svarende til betydningen af sidegevinst en del af forekomsterne modificeret af adjektivet positiv, jf. figur 3. Figur 3. Semantisk prosodi for sideeffekt 13 Rundell (2002) betragter fænomenet som en særlig leksikografisk udfordring, idet det ofte kun vanskeligt lader sig beskrive i ordbøger, samtidig med at det kan være af afgørende betydning for acceptabel sprogbrug. 14 Forfatteren blev gjort opmærksom på dette eksempel af Henrik Gottlieb, Engelsk Institut, KU. STU DIE R I NORDISK
10 Spørgsmålet er nu, hvorvidt sideeffekt-eksemplerne fra K90 og K2000 empirisk kan støtte konklusionen, at sideeffekt faktisk har ændret dets semantisk-prosodiske egenskaber fra de oprindelige engelske til en mere selvstændig dansk positiv bivirkning, og dermed måske har fundet en semantisk niche i dansk. Hvor mange eksempler på et ords måske ændrede semantik har man brug for, før man med sikkerhed kan udelukke korpuskompositionel støj og kan fremsætte generelle udsagn om bestemte semantiske forandringer i et sprog som helhed? 2.5. Ordtopologi Der skal gives ét eksempel på sammenlignende ordtopologiske undersøgelser for at illustrere de metodiske problemer, der knytter sig hertil. Almindeligvis betragtes hovedsætningsordstilling af ikke i bisætninger som substandard som fx i? Anne serverer kaffe, fordi Peter drikker ikke te. Det skal undersøges, hvor udbredt denne konstruktion, der måske især forekommer i talesprog, er i de to skriftsproglige korpusser. Intuitivt eller måske også ud fra en antagelse om, at talesproget determinerer skriftsproget skulle man forvente, at den ikkekanoniske placering af ikke i bisætninger er mere udbredt i K2000 end i K90. Om end en tilbundsgående undersøgelse med det eksisterende søgesystem ikke umiddelbart er mulig, viser undersøgelser af bestemte ordtopologiske mønstre, fx en søgning på sekvensen at-pronomen-verbum-ikke, at den ikke-kanoniske placering af ikke er mere udbredt i K90 end i K2000 figur 4 viser en række eksempler. Figur 4. Eksempler fra K90 på ikke-kanonisk placering af ikke 3. Korpus 2000 til hvilken nytte? Eksemplerne ovenfor viser, at sammenlignende korpusundersøgelser i en række tilfælde kan medføre tvivlsomme fortolkninger og generaliseringer vedrørende sproglige forandringer og man må derfor spørge, hvad man dog skal med et korpus, der ganske vist påstås at kunne bruges til empiriske sprogundersøgelser, 26 STU DIE R I NORDISK
11 der dog så alligevel er præget af tilfældigheder og unøjagtigheder i en grad, så man er henvist til sin egen sproglige intuition, når man skal vurdere undersøgelsesresultaterne. Problemet er dog næppe brugen af et korpus som sådan, men snarere de metoder, man lægger til grund for korpusbaserede undersøgelser i almindelighed og for sammenlignende undersøgelser i særdeleshed. En grundlæggende metodisk vanskelighed ved korpusbaserede sprogundersøgelser er muligheden for at kvantificere sproglige fænomener, mens traditionelle sprogundersøgelser ofte tager udgangspunkt i en kvalitativ beskrivelse af et bestemt sprogligt fænomen, som man måske tilfældigt er stødt på. Undersøgelsens fokus forskydes altså i korpusbaserede undersøgelser let fra en beskrivelse af hvad man ser, til en beskrivelse af, hvor meget man ser hvor idealet måske burde være en kombination: både beskrivelsen af et fænomen og dets måske skiftende udbredelse. Hertil kommer, at de forekomsttal, man umiddelbart ser ved sammenligningen af to korpusser, ikke nødvendigvis er sammenlignelige. I den fysiske verden er det for de fleste evident, at én kilometer er mere end ti kilometer, men om én kilometer er meget eller lidt, afhænger også af den kontekst, hvori mængedeangivelsen bliver brugt. Ti kilometer kan således være en ganske betragtelig vejlængde, hvis den skal tilbagelægges til fods, mens den samme vejlængde tilbagelagt i bil er knapt så imponerende. Ganske tilsvarende gælder for de forekomsttal, man finder i et korpus: de giver ingen mening i sig selv, men kun i forhold til noget andet, indenfor en kontekst det er således ganske intetsigende, at konstatere at mand har genitivformer i K90 mod i K2000, når man ikke i det mindste sætter disse tal i forhold til, hvor mange forekomster lemmaet mand har i de to korpusser: gør man det, finder man, at andelen af genitivformer for lemmaet mand er 2,0% i begge korpusser. Med andre ord kan forekomsttal aldrig tages for pålydende i korpusundersøgelser, og for hver type undersøgelse kræves der en række metodiske overvejelser, inden man giver sig til at konkludere. Som K2000's søgesystem er opbygget nu, får brugeren i virkeligheden ikke megen metodisk hjælp det overlades i vid udstrækning til brugeren selv at fortolke de kvantitative resultater hensigtsmæssigt. Så selvom sigtet med K2000's webbaserede søgesystem var, at gøre det let for enhver sproginteresseret af lave sine egene sproglige undersøgelser, bidrager grænsefladen ikke til at minimere metodiske fejlgreb en ulempe, som fremtidige versioner af grænsefladen bør råde bod på. Hertil kommer så spørgsmålet, hvad sammenlignelighed af korpusser egentlig vil sige. K90's og K2000's sammensætning er tilstræbt identiske, men i praksis, dvs. i de viste eksempler, er der noget, der tyder på, at sammensætningen ikke kan være så identisk endda. Det gælder først og fremmest forskelle i udbredelsen af bestemte lemmaer, som man intuitivt skulle mene havde en STU DIE R I NORDISK
12 konstant udbredelse i sproget inden for en tidsramme af ca. 10 år, fx bil, jul, mand osv. Og ganske rigtigt er det især andelen af avismateriale i de to korpusser, som er meget forskelligt, ca. en tredjedel i K90 mod to tredjedele i K2000. Dette rejser spørgsmålet, hvordan man sikrer sammenlignelighed af to korpusser mht. til en bestemt dimension, i dette tilfælde tidsdimensionen: hvordan burde et K90 og et K2000 sammensættes, så man kunne være sikker på, at de forskelle, man kan konstatere imellem dem, vitterligt er sikre indicier på tidsbestemte sproglige forandringer? Løsningen på de skitserede problemstillinger må findes i udviklingen af en generel metodologi for korpusdesign og -udnyttelse et område, som Det Danske Sprog- og Litteraturselskab trods beskedne resurser arbejder indenfor med henblik på at kunne forbedre kvaliteten både af de eksisterende korpusser og af de søgesystemer, der knytter sig til dem. Målet for 2004 er at kunne lancere et forbedret webinterface for K2000, hvori der vil være taget højde for en hel række af de søgemetodiske problemstillinger, som blev skitseret i dette bidrag. Litteratur Andersen, M.S., Asmussen, H., Asmussen, J. (2002): The Project of Korpus 2000 Going Public; in: A. Braasch and C. Povlsen (eds.): Proceedings of the Tenth EURALEX International Congress, EURALEX 2002, København. Asmussen, J. (2001): Korpus Et overblik over projektets baggrund, fremgangsmåder og perspektiver. NyS 30. Nydanske studier & almen kommunikationsteori, København. Asmussen, J. (under udgivelse): Towards a methodology for corpus-based studies of linguistic change. Contrastive observations and their possible diachronic interpretations in the Korpus 2000 and Korpus 90 Corpora of Danish; in: Archer, Rayson, Wilson (eds.): Corpus Linguistics Around the World. Rodopi, Amsterdam. Bick, E. (2003a): Morfosyntaktisk opmærkede corpora for dansk: Korpus 90/2000 og Arboretum; in: 9. Møde om Udforskningen af Dansk Sprog oktober Proceedings. Aarhus Universitet. Bick, E. (2003b): A CG & PSG hybrid approach to automatic corpus annotation; in: Simov, K. & Osenova P. (eds.): Proceedings of the Workshop on Shallow Processing of Large Corpora (SProLaC 2003) held in conjunction with the Corpus Linguistics 2003 Conference. UCREL technical paper no. 17. UCREL, Lancaster University. 28 STU DIE R I NORDISK
13 Christ, O. (1994): A modular and flexible architecture for an integrated corpus query system. COMPLEX 94 Proceedings, Budapest. Church, K. & P. Hanks (1989): Word association norms, mutual information and lexicography. ACL Proceedings, 27 th Annual Meeting, Vancouver. Church, K. et al. (1991): Using Statistics in Lexical Analysis; in: Zernik (ed.): Lexical Acquisition. Exploiting On-Line Resources to Build a Lexicon. Hillsdale, New Jersey Elbro, C. (2002): Ift, ifm, mht, mhp og andre uspecifikke præpositioner. Mål og Mæle 3:2002, København, pp Jarvad, P. (1999): Nye Ord. Ordbog over nye ord i dansk København. Norling-Christensen, O. & J. Asmussen (1998): The Corpus of The Danish Dictionary; in: Lexikos 8, Afrilex Series 8:1998, Stellenbosch, pp Rundell, M. (2002): Good Old-fashioned Lexicography: Human Judgment and the Limits of Automation; in M-H. Corréard (ed.): Lexicography and Natural Language Processing. A Festschrift in Honour of B.T.S. Atkins. EURALEX STU DIE R I NORDISK
sproget.dk en internetportal for det danske sprog
sproget.dk en internetportal for det danske sprog Ida Elisabeth Mørch, Dansk Sprognævn Lars Trap-Jensen, Det Danske Sprog- og Litteratuselskab 1 Baggrunden 2003 Sprog på spil 2005 Ekstrabevilling 2006
Læs mereProsodi i ledsætninger
Eksamensopgave 2 Dansk talesprog: Prosodi og syntaks Prosodi i ledsætninger Ruben Schachtenhaufen Indledning I denne opgave vil jeg undersøge nogle forhold vedrørende prosodi og syntaks i ledsætninger
Læs mereRita Lenstrup. Kritiske bemærkninger til artikel af Henning Bergenholtz, Helle Dam og Torben Henriksen i Hermes 5 l990, side
Rita Lenstrup 109 Kritiske bemærkninger til artikel af Henning Bergenholtz, Helle Dam og Torben Henriksen i Hermes 5 l990, side 127-136. 1. Indledning I Hermes nr. 5 præsenteredes en sammenlignende vurdering
Læs mereIt-støttet excerpering og registrering af nye ord og ordforbindelser
It-støttet excerpering og registrering af nye ord og ordforbindelser Møde i Selskab for Nordisk Filologi 30. oktober 2008 Jakob Halskov Projektforsker, ph.d. Dansk Sprognævn jhalskov@dsn.dk Disposition
Læs mereKorpusbaseret lemmaselektion og opdatering
Korpusbaseret lemmaselektion og opdatering Jørg Asmussen Afdeling for Digitale Ordbøger og Tekstkorpora Det Danske Sprog- og Litteraturselskab www.dsl.dk Program 1. Introduktion til DSL 2. Introduktion
Læs mereHovedresultater af DREAMs befolkningsfremskrivning
Hovedresultater af DREAMs 26- befolkningsfremskrivning 3. juni 26 Marianne Frank Hansen & Lars Haagen Pedersen Udviklingen i den samlede befolkning Danmarks befolkning er vokset fra 2,4 mio. personer i
Læs mereCorpusEye - Et brugervenligt web-interface for grammatisk opmærkede korpora
Peter Widell og Mette Kunøe (udg.): 10. Møde om Udforskningen af Dansk Sprog Århus 2004 CorpusEye - Et brugervenligt web-interface for grammatisk opmærkede korpora Af Eckhard Bick (Syddansk Universitet)
Læs merea. Find ud af mere om sprogteknologi på internettet. Hvad er nogle typiske anvendelser? Hvor mange af dem bruger du i din hverdag?
En computer forstår umiddelbart ikke de sprog vi mennesker taler og skriver. Inden for sprogteknologien (på engelsk: Natural Language Processing eller NLP), der er en gren af kunstig intelligens, beskæftiger
Læs mereIntro til design og brug af korpora
Intro til design og brug af korpora Jørg Asmussen ja@dsl.dk Det Danske Sprog- og Litteraturselskab www.dsl.dk Intro til design og brug korpuslingvistik af korpora Jørg Asmussen ja@dsl.dk Det Danske Sprog-
Læs mereKvantitative metoder inden for korpuslingvistiske projekter
Kvantitative metoder inden for korpuslingvistiske projekter Illustreret ved eksempler fra Den Danske Ordbogs korpus, Korpus 2000 og Korpus 90 Jørg Asmussen Det Danske Sprog- og Litteraturselskab, DSL ja@dsl.dk
Læs mereFremstillingsformer i historie
Fremstillingsformer i historie DET BESKRIVENDE NIVEAU Et referat er en kortfattet, neutral og loyal gengivelse af tekstens væsentligste indhold. Du skal vise, at du kan skelne væsentligt fra uvæsentligt
Læs mereHvad sker der med sin i moderne dansk og hvorfor sker det? Af Torben Juel Jensen
Hvad sker der med sin i moderne dansk og hvorfor sker det? Af Torben Juel Jensen De fleste danskere behøver bare at høre en sætning som han tog sin hat og gik sin vej, før de er klar over hvilken sprogligt
Læs mereRESUME TRANSLATION MEMORY-SYSTEMER SOM VÆRKTØJ TIL JURIDISK OVERSÆTTELSE. KRITISK VURDERING AF ANVENDELIGHEDEN AF TRANSLATION MEMORY-SYSTEMER TIL
RESUME TRANSLATION MEMORY-SYSTEMER SOM VÆRKTØJ TIL JURIDISK OVERSÆTTELSE. KRITISK VURDERING AF ANVENDELIGHEDEN AF TRANSLATION MEMORY-SYSTEMER TIL OVERSÆTTELSE AF SELSKABSRETLIG DOKUMENTATION. I den foreliggende
Læs mere2.7. HVAD BETYDER DET EGENTLIG AT BETEGNE SIG SELV SOM TROENDE?
2.7. HVAD BETYDER DET EGENTLIG AT BETEGNE SIG SELV SOM TROENDE? Abstract: Danmark har i de seneste 50-60 år været igennem dramatiske forandringer på en række samfundsområder inklusive det religiøse. Disse
Læs mereDet islandske ordklasseopmærkede korpus MÍM Sigrún Helgadóttir
Det islandske ordklasseopmærkede korpus MÍM Sigrún Helgadóttir Det islandske ordklasseopmærkede korpus Oversigt over foredraget: Hvor stammer projektet fra? Hvad er et ordklasseopmærket korpus? Hvordan
Læs mereSvensk model for bibliometri i et norsk og dansk perspektiv
Notat Svensk model for bibliometri i et norsk og dansk perspektiv 1. Indledning og sammenfatning I Sverige har Statens Offentlige Udredninger netop offentliggjort et forslag til en kvalitetsfinansieringsmodel
Læs mereUndersøgelse af det faglige indgangsniveau
Undersøgelse af det faglige indgangsniveau 74 pct. af undervisere på første studieår på 11 udvalgte uddannelser vurderer, at nye studerende har et tilstrækkeligt indgangsniveau. Over de seneste 20 år er
Læs mereAnalyseinstitut for Forskning
Analyseinstitut for Forskning Folk og forskning Forskningsformidling - Danskernes kilder til viden om forskning Notat 2001/2 ISSN: 1399-8897 Analyseinstitut for Forskning/ The Danish Institute for Studies
Læs mereFuldstændig fantastisk?
Fuldstændig fantastisk? Holger Juul, lektor, ph.d., Center for Læseforskning, Københavns Universitet Enten-eller vs. både-og I marts-nummeret af Nyt om Ordblindhed tager Erik Arendal afstand fra det han
Læs mereSkolevægring. Resultater fra en spørgeskemaundersøgelse blandt skoleledere på danske folkeskoler og specialskoler
Skolevægring Resultater fra en spørgeskemaundersøgelse blandt skoleledere på danske folkeskoler og specialskoler Udarbejdet af Analyse & Tal for Institut for Menneskerettigheder juli 017 Indledning Udsendelse
Læs mereSpørgsmål om ophavsret den islandske erfaring
Spørgsmål om ophavsret den islandske erfaring Sigrún Helgadóttir Árni Magnússon instituttet for islandske studier Leksikografisk afdeling Spåkteknologisk infrastruktur Nordiskt seminarium vid Wallenberg
Læs mereKarrierekvinder og -mænd
Rockwool Fondens Forskningsenhed Arbejdspapir 35 Karrierekvinder og -mænd Hvem er de? Og hvor travlt har de? Jens Bonke København 2015 Karrierekvinder og -mænd Hvem er de? Og hvor travlt har de? Arbejdspapir
Læs mereDiaSketching og afterminologisering hvornår er en term en term? Nordterm 2005 9. - 12. juni 2005 Reykjavik, Island
DiaSketching og afterminologisering hvornår er en term en term? Nordterm 2005 9. - 12. juni 2005 Reykjavik, Island Jakob Halskov (jh.id@cbs.dk) Dept. of Computational Linguistics Copenhagen Business School
Læs mereAt måle og veje korpusser et aspekt af arbejdet bag de store almensproglige korpusser for dansk
At måle og veje korpusser et aspekt af arbejdet bag de store almensproglige korpusser for dansk Jørg Asmussen Det Danske Sprog- og Litteraturselskab www.dsl.dk Bidrag til Bente Maegaard-festskrift KLADDE-VERSION
Læs mereRisikofaktorudviklingen i Danmark fremskrevet til 2020
23. marts 9 Arbejdsnotat Risikofaktorudviklingen i Danmark fremskrevet til Udarbejdet af Knud Juel og Michael Davidsen Baseret på data fra Sundheds- og sygelighedsundersøgelserne er der ud fra køns- og
Læs mereDelma l for Danish. Det talte sprog. Måltaksonomi: Beginners Middlegroup Advanced Efter Y4 Forstå enkle ord og vendinger knyttet til dagligdagen
Delma l for Danish Det talte Måltaksonomi: Beginners Middlegroup Advanced Efter Y4 Forstå enkle ord og vendinger knyttet til dagligdagen Fortælle hvad man har oplevet Fremlægge, fortælle, forklare og interviewe
Læs mereFaglige delmål og slutmål i faget Dansk. Trin 1
Faglige delmål og slutmål i faget Dansk. Trin 1 Undervisningen skal lede frem mod, at eleverne i 1. klasse har tilegnet sig kundskaber og Det talte sprog Undervisningen tager udgangspunkt i elevernes sproglige
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Læs mereSådan bruger du Den Danske Regnskabsordbog
Sådan bruger du Den Danske Regnskabsordbog Visning Når du får et søgeresultat, kan du gøre skriften større eller mindre ved at klikke på knapperne yderst til højre på skærmen: større, mindre, nulstil.
Læs mereBedømmelsesvejledning til prøven i skriftlig fremstilling D, december Dansk som andetsprog
Bedømmelsesvejledning til prøven i skriftlig fremstilling D, december 2016 Dansk som andetsprog Information om prøven i skriftlig fremstilling D Prøven i skriftlig fremstilling D består af et teksthæfte,
Læs mereTurismeerhvervets forventninger til 2011 og 2012
Økonomisk analyse fra HORESTA oktober 2011 Turismeerhvervets forventninger til 2011 og 2012 Om analysen HORESTA Viden & Udvikling har i maj/juni 2011 gennemført en omfattende undersøgelse blandt medlemsvirksomhederne
Læs mereLæring af test. Rapport for. Aarhus Analyse Skoleåret
Læring af test Rapport for Skoleåret 2016 2017 Aarhus Analyse www.aarhus-analyse.dk Introduktion Skoleledere har adgang til masser af data på deres elever. Udfordringen er derfor ikke at skaffe adgang
Læs mereSyv veje til kærligheden
Syv veje til kærligheden Pouline Middleton 1. udgave, 1. oplag 2014 Fiction Works Aps Omslagsfoto: Fotograf Steen Larsen ISBN 9788799662999 Alle rettigheder forbeholdes. Enhver form for kommerciel gengivelse
Læs mereVidensmedier på nettet
Vidensmedier på nettet En sociokulturel forståelse af læring kan bringe os til at se bibliotekernes samlinger som læringsressourcer og til at rette blikket mod anvendelsespotentialerne. fra Aarhus Universitet
Læs mereFaglig læsning i matematik
Faglig læsning i matematik af Heidi Kristiansen 1.1 Faglig læsning en matematisk arbejdsmåde Der har i de senere år været sat megen fokus på, at danske elever skal blive bedre til at læse. Tidligere har
Læs mereFØDEVARESTYRELSEN KUNDETILFREDSHEDSUNDERSØGELSE
FØDEVARESTYRELSEN KUNDETILFREDSHEDSUNDERSØGELSE August 2013 1 Om undersøgelsen Læsevejledning til rapporten. Advice A/S har på vegne af Fødevarestyrelsen gennemført en måling af tilfredsheden hos styrelsens
Læs mereDanskerne, islam og muslimer Af professor Peter Nannestad, Institut for Statskundskab, Aarhus Universitet
Danskerne, islam og muslimer Af professor Peter Nannestad, Institut for Statskundskab, Aarhus Universitet Siden terrorangrebet den 11. september 2001 og Muhammed-krisen i 2005 er spørgsmålet om danskernes
Læs mereSkolen påvirker hele familien
JANUAR 2019 NYT FRA RFF Skolen påvirker hele familien N år et barns skolestart udskydes, har det konsekvenser - ikke kun for barnet selv, men også for forældrene og for barnets ældre søskende. Det viser
Læs mereSprogteknologiske resourcer for islandsk leksikografi
Eiríkur Rögnvaldsson Sprogteknologiske resourcer for islandsk leksikografi Seminar om leksikografi og sprogteknologi Schæffergården 31. januar 2010 Foredragets emne Islandsk sprogteknologi omkring århundredskiftet
Læs mereKommunikative færdigheder Undervisningen skal lede frem mod, at eleverne har tilegnet sig kundskaber og færdigheder, der sætter dem i stand til at
ODENSE FRISKOLE Fagplan for Engelsk Formål Formålet med undervisningen i engelsk er, at eleverne tilegner sig kundskaber og færdigheder, således at de kan forstå talt og skrevet engelsk og kan udtrykke
Læs mereLæsevejledning til resultater på regions- og sygehusplan
Læsevejledning til resultater på regions- og sygehusplan Indhold 1. Overblik...2 2. Sammenligninger...2 3. Hvad viser figuren?...3 4. Hvad viser tabellerne?...6 6. Eksempler på typiske spørgsmål til tabellerne...9
Læs mereNordjysk Konjunkturbarometer RESUMÉ 1. KVARTAL 2000
Konjunkturanalysegruppen Institut for Erhvervsstudier, Aalborg Universitet Jesper Lindgaard Christensen Bent Dalum Lars Gelsing Carsten Stig Poulsen Nordjysk Konjunkturbarometer RESUMÉ 1. KVARTAL 1. Baggrund
Læs mereSolidaritet, risikovillighed og partnerskønhed
Rockwool Fondens Forskningsenhed Arbejdspapir 36 Solidaritet, risikovillighed og partnerskønhed Jens Bonke København 1 Solidaritet, risikovillighed og partnerskønhed Arbejdspapir 36 Udgivet af: Rockwool
Læs mereSocialtilsynets inddragelse af oplysninger fra borgerne i det driftsorienterede
Socialtilsynets inddragelse af oplysninger fra borgerne i det driftsorienterede tilsyn Udgivet af Socialstyrelsen September 2017 Publikationen er udgivet af Socialstyrelsen Edisonsvej 18, 1. 5000 Odense
Læs mereKriminalitet og alder
JUSTITSMINISTERIETS FORSKNINGSKONTOR NOVEMBER 2015 Kriminalitet og alder Udviklingen i strafferetlige afgørelser 2005-2014 Dette notat angår udviklingen i den registrerede kriminalitet i de seneste ti
Læs mereManuskriptvejledning De Studerendes Pris
Fremsendelse af artikel Artikler skrevet på baggrund af bachelorprojekter, der er afleveret og bestået i det annoncerede tidsrum, kan deltage i konkurrencen om De Studerendes Pris. Det er kun muligt at
Læs mereErhvervslivet imod tvungen adskillelse af revision og rådgivning
Erhvervslivet imod tvungen adskillelse af revision og rådgivning Det diskuteres i øjeblikket at ændre reglerne for revisorer for at skabe en større adskillelse imellem revisor og kunder. Et forslag er
Læs mereKorpus 2000 m.fl. Jørg Asmussen, Det Danske Sprog- og Litteraturselskab, DSL. 24. april Korpus / 47
Korpus 2000 mfl Jørg Asmussen, Det Danske Sprog- og Litteraturselskab, DSL 24 april 2006 Korpus 2000 1 / 47 Overblik ODS Den Danske Ordbog Korpus 2000 Flere korpora Søgeværktøjer Det Danske Sprog- og Litteraturselskab:
Læs mereAnalyse 10. juni 2015
Analyse 1. juni 21 Hvad har valgkampen handlet om indtil videre? Af Nicolai Kaarsen I november 214 tilkendegav danskerne, at emner som arbejdsløshed, indvandring og beskyttelse af miljøet var blandt de
Læs mereProblem 1: Trykbevidsthed
Page 1 of 5 04/20/09 - Sammen satte ord - fra et fonetisk perspektiv Retskrivningsordbogen har en enkelt regel hvor skrivemåden gøres afhængig af udtalen. Det drejer om 18? om hvorvidt en ordforbindelse
Læs mereCensorvejledning for censorer i skriftlig fransk begyndersprog og fortsættersprog A, hhx. Analog prøve
Maj 2018 Censorvejledning for censorer i skriftlig fransk begyndersprog og fortsættersprog A, hhx Analog prøve Den skriftlige eksamen i fransk er først og fremmest en sproglig prøve, som skal give eksaminanderne
Læs mereMadkulturen - Madindeks 2015 81. Idealer om det gode aftensmåltid
Madkulturen - Madindeks 2015 81 5. Idealer om det gode aftensmåltid 82 Madkulturen - Madindeks 2015 5. Idealer om det gode aftensmåltid Madkultur handler både om, hvad danskerne spiser, men også om hvilke
Læs merePå alle områder er konklusionen klar: Der er en statistisk sammenhæng mellem forældre og børns forhold.
Social arv 163 8. Social arv nes sociale forhold nedarves til deres børn Seks områder undersøges Der er en klar tendens til, at forældrenes sociale forhold "nedarves" til deres børn. Det betyder bl.a.,
Læs mereLæseundersøgelse blandt unge i målgruppe for forberedende grunduddannelse (FGU)
Læseundersøgelse blandt unge i målgruppe for forberedende grunduddannelse (FGU) Anna Steenberg Gellert og Carsten Elbro, Center for Læseforskning, Københavns Universitet Baggrund På den nyligt oprettede
Læs meretemaanalyse 2000-2009
temaanalyse DRÆBTE I Norden -29 DATO: December 211 FOTO: Vejdirektoratet ISBN NR: 97887766554 (netversion) COPYRIGHT: Vejdirektoratet, 211 2 dræbte i norden -29 Dette notat handler om ulykker med dræbte
Læs mereAt konstruere et socialt rum. Annick Prieur og Lennart Rosenlund
At konstruere et socialt rum Annick Prieur og Lennart Rosenlund Vort sigte Vise hvorledes vi er gået frem, når vi har konstrueret et socialt rum ud fra surveydata fra en dansk by Aalborg efter de samme
Læs mereSkole og Samfunds spørgeskemaundersøgelse 2008 -Elevplaner og kvalitetsrapporter
Skole og Samfunds spørgeskemaundersøgelse 2008 -Elevplaner og kvalitetsrapporter Sammenfatning Forældrene er glade for elevplanerne 70 % af skolebestyrelsesmedlemmerne i Skole og Samfunds undersøgelse
Læs mereSemantiske relationer og begrebssystemer
Semantiske relationer og begrebssystemer I denne opgave vil jeg beskæftige mig med semantiske relationer og begrebssystemer med udgangspunkt i en oplysende tekst fra Politikens Vinbog (se bilag). Jeg vil
Læs mereAnalyseinstitut for Forskning
Analyseinstitut for Forskning Bioteknologi Opfattelser og holdninger blandt danskere, 1989-2000 Notat 2001/3 ISSN: 1399-8897 Analyseinstitut for Forskning/ The Danish Institute for Studies in Research
Læs mereStatistik viden eller tilfældighed
MATEMATIK i perspektiv Side 1 af 9 DNA-analyser 1 Sandsynligheden for at en uskyldig anklages Følgende histogram viser, hvordan fragmentlængden for et DNA-område varierer inden for befolkningen. Der indgår
Læs mereBrugerundersøgelse Lægemiddelkorpus
1 Brugerundersøgelse Lægemiddelkorpus Vi føler, at vi med Korpus-redskabet har fået et løft i forbindelse med vores oversættelsesarbejde både kvalitets- og tidsmæssigt (lægemiddelvirksomhed) Oversættelsesredskabet
Læs mereHar I totalt rygeforbud på virksomhedens matrikel (altså såvel indenfor som udenfor)? 76%
Notat Rygning i erhvervslivet Til: Dansk Erhverv Fra: MJC/MMM Rygning bliver stadig mindre udbredt blandt danskerne, og mange steder er det ikke længere tilladt at ryge. Dansk Erhverv har i juni 2014 undersøgt,
Læs mereStigende utilfredshed med jobcentrene i Danmark
ANALYSE Stigende utilfredshed med jobcentrene i Danmark Resumé De danske virksomheder oplever i disse år en mangel på arbejdskraft, som ikke er oplevet magen siden dagene før finanskrisen i slutningen
Læs mereMetoder og struktur ved skriftligt arbejde i idræt.
Metoder og struktur ved skriftligt arbejde i idræt. Kort gennemgang omkring opgaver: Som udgangspunkt skal du når du skriver opgaver i idræt bygge den op med udgangspunkt i de taksonomiske niveauer. Dvs.
Læs mereAARHUS KOMMUNE BRUGERTILFREDSHEDSUNDERSØGELSE 2017 BOSTØTTE, BOFÆLLESSKABER OG BOTILBUD I VOKSENHANDICAP
AARHUS KOMMUNE BRUGERTILFREDSHEDSUNDERSØGELSE 2017 BOSTØTTE, BOFÆLLESSKABER OG BOTILBUD I VOKSENHANDICAP INDHOLD Afsnit 01 Introduktion Side 03 Afsnit 02 Læsevejledning Side 05 Afsnit 03 Sammenfatning
Læs mereSILKEBORG KOMMUNE FORÆLDRETILFREDSHEDSUNDERSØGELSE 2018 SKOLE OG SFO
SILKEBORG KOMMUNE FORÆLDRETILFREDSHEDSUNDERSØGELSE 2018 SKOLE OG SFO 1 INDHOLD Afsnit 01 Introduktion Side 03 Afsnit 02 Sammenfatning Side 05 Afsnit 03 Skoleresultater Side 07 Afsnit 04 SFO-resultater
Læs mereBrugervejledning til Højkvalitetsdokumentationen og Dialogforummet på Danmarks Statistiks hjemmeside
Brugervejledning til Højkvalitetsdokumentationen og Dialogforummet på Danmarks Statistiks hjemmeside Forord Denne vejledning beskriver baggrunden for begreber og sammenhænge i Danmarks Statistiks dokumentationssystem
Læs mereJUSTITSMINISTERIETS FORSKNINGSKONTOR NOVEMBER 2017
JUSTITSMINISTERIETS FORSKNINGSKONTOR NOVEMBER 2017 UDVIKLINGEN I ANTAL ANMELDELSER OG I STRAFFENES ART OG LÆNGDE FOR VOLD, 2007-2016 På baggrund af Danmarks Statistiks tal vedrørende anmeldelser og strafferetlige
Læs mere4. Snittets kædebrøksfremstilling og dets konvergenter
Dette er den fjerde af fem artikler under den fælles overskrift Studier på grundlag af programmet SKALAGENERATOREN (forfatter: Jørgen Erichsen) 4. Snittets kædebrøksfremstilling og dets konvergenter Vi
Læs mereBONUSINFORMATIONER i forbindelse med emnet Billeder og grafik
BONUSINFORMATIONER i forbindelse med emnet Billeder og grafik Dette dokument indeholder yderligere informationer, tips og råd angående: Tabelfunktionen SmartArtfunktionen Billedfunktionen Samt en ekstra
Læs mereRapport 23. november 2018
Rapport 23. november 2018 Proj.nr. 2004280 Version 1 EVO/MT Principper for og forslag til repræsentative stikprøveplaner til analyse af konsekvensen af produktionsændringer for værdi- og kvalitetsvurdering
Læs mereEVALUERING AF BOLIGSOCIALE AKTIVITETER
Guide EVALUERING AF BOLIGSOCIALE AKTIVITETER Det er rart at vide, om en aktivitet virker. Derfor følger der ofte et ønske om evaluering med, når I iværksætter nye aktiviteter. Denne guide er en hjælp til
Læs mereOm brugen af farvebetegnelser i dansk på internettet
Om brugen af farvebetegnelser i dansk på internettet Esben Alfort Brugen af farvetermer i dansk, som det skrives på internettet, viser, at bestemte farver kan modificeres eller sammensættes for en mere
Læs mereMetoder og erkendelsesteori
Metoder og erkendelsesteori Af Ole Bjerg Inden for folkesundhedsvidenskabelig forskning finder vi to forskellige metodiske tilgange: det kvantitative og det kvalitative. Ser vi på disse, kan vi konstatere
Læs mereSamarbejdet mellem forvaltning og skoleledelse
Samarbejdet mellem forvaltning og skoleledelse En undersøgelse af samarbejdet om elevernes læring og trivsel på tværs af landets kommuner Fakta og spørgsmål til refleksion SKOLE Indhold 3 Hvorfor denne
Læs mereKriminalitet og alder
JUSTITSMINISTERIETS FORSKNINGSKONTOR SEPTEMBER 2014 Kriminalitet og alder Udviklingen i strafferetlige afgørelser 2004-2013 Dette notat angår udviklingen i den registrerede kriminalitet i de seneste ti
Læs mereSAMMENFATNING RESUME AF UDREDNINGEN ARBEJDSLIVSKVALITET OG MODERNE ARBEJDSLIV
SAMMENFATNING RESUME AF UDREDNINGEN ARBEJDSLIVSKVALITET OG MODERNE ARBEJDSLIV Af Stine Jacobsen, Helle Holt, Pia Bramming og Henrik Holt Larsen RESUME AF UDREDNINGEN ARBEJDSLIVSKVALITET OG MODERNE ARBEJDSLIV
Læs mereProduktsøgning. Eniro Krak. Tabelrapport. Oktober 2014
Eniro Krak Produktsøgning Tabelrapport Oktober 2014 Materialet er fortroligt og må ikke anvendes uden for klientens organisation uden forudgående skriftligt samtykke fra Radius Kommunikation A/S Indhold
Læs mereUndervisningen skal samtidig udvikle elevernes bevidsthed om engelsk sprog og sprogbrug samt om sprogtilegnelse.
HAUBRO FRISKOLE Fagplan for Engelsk Formål Formålet med undervisningen i engelsk er, at eleverne tilegner sig kundskaber og færdigheder, således at de kan forstå talt og skrevet engelsk og kan udtrykke
Læs mereNordjysk Konjunkturbarometer RESUMÉ 4. KVARTAL 2000
Konjunkturanalysegruppen Institut for Erhvervsstudier, Aalborg Universitet Jesper Lindgaard Christensen Bent Dalum Morten Berg Jensen Carsten Stig Poulsen Nordjysk Konjunkturbarometer RESUMÉ 4. KVARTAL
Læs mereSmå virksomheders andel af offentlige
VELFUNGERENDE MARKEDER NR 26 19 Små virksomheders andel af offentlige I artiklen fremlægges nye data, som belyser små virksomheders andel af de offentlige opgaver, som sendes i EU-udbud. Analysen viser
Læs mereKomparativt syn på Danmarks og Norges mikrofinans sektor
Konklusion Komparativt syn på s og s mikrofinans sektor For både den danske og norske sektor gør de samme tendenser sig gældende, nemlig: 1. Private virksomheders engagement i mikrofinans har været stigende.
Læs mereSenere skolestart har ingen effekt på uddannelsesniveau
Nyt fra November 2015 Senere skolestart har ingen effekt på uddannelsesniveau Børn, der startede et år senere i skole, klarer sig ikke bedre end børn, der startede skole rettidigt, når der måles på færdiggjort
Læs mereForslag til principielle ændringer af dansk retskrivning til offentliggørelse i Retskrivningsordbogen 2012.
Kulturminister Per Stig Møller Nybrogade 2 1203 Kbh. K Udkast til brev. Forslag til principielle ændringer af dansk retskrivning til offentliggørelse i Retskrivningsordbogen 2012. Med henvisning til Lov
Læs mereHans Hansen STANDARD RAPPORT. Adaptive General Reasoning Test
Adaptive General Reasoning Test STANDARD RAPPORT Dette er en fortrolig rapport, som udelukkende må anvendes af personer med en gyldig certificering i anvendelse af værktøjet AdaptGRT fra DISCOVER A/S.
Læs mereFlere unge har brug for fleksuddannelse?
Flere unge har brug for fleksuddannelse? Knap hver femte ung f i dag ikke en ungdomsuddannelse. Det betyder, at der fra hver gang er ca. 11.000 unge, som har brug for et andet tilbud end de eksisterende
Læs mereORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester
D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T B l e g d a m s v e j 3 B 2 2 0 0 K ø b e n h a v n N ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER
Læs mereEn sammenligning af driftsomkostningerne i den almene og private udlejningssektor
En sammenligning af driftsomkostningerne i den almene og private udlejningssektor bl danmarks almene boliger 1 1. Indledning og sammenfatning En analyse af driftsomkostningerne i hhv. den almene og private
Læs mereVisiRegn: En e-bro mellem regning og algebra
Artikel i Matematik nr. 2 marts 2001 VisiRegn: En e-bro mellem regning og algebra Inge B. Larsen Siden midten af 80 erne har vi i INFA-projektet arbejdet med at udvikle regne(arks)programmer til skolens
Læs mereAnalyse. Kontanthjælpsreformen har fået flere unge i uddannelse eller beskæftigelse men forbliver de der? 29. april 2015
Analyse 29. april 215 Kontanthjælpsreformen har fået flere unge i uddannelse eller beskæftigelse men forbliver de der? Af Kristian Thor Jakobsen og Katrine Marie Tofthøj Kontanthjælpsreformen, der blev
Læs mereUndervisningsplan for engelsk
Undervisningsplan for engelsk Formål: Formålet med undervisningen i engelsk er, at eleverne tilegner sig kundskaber og færdigheder, således at de kan forstå talt og skrevet engelsk og kan og tør udtrykke
Læs mereDet Røde Hav og de fire fokusøer Lærervejledning
Det Røde Hav og de fire fokusøer Lærervejledning Asymmetrisk tænkning - det vi plejer at gøre Assymmetrisk tænkning er den tænkning, som oftest bruges, når en gruppe af personer skal blive enige om noget.
Læs mereDemografiske udfordringer frem til 2040
Demografiske udfordringer frem til 2040 Af Niels Henning Bjørn, NIHB@kl.dk Danmarks befolkning vokser i disse år som følge af længere levetid, store årgange og indvandring. Det har især betydningen for
Læs mereOplevet mobildækning. Publikationen kan hentes på: www.erst.dk
Oplevet mobildækning Publikationen kan hentes på: www.erst.dk Maj 2013 Indholdsfortegnelse SIDE Forord 3 Hovedresultater 4 Ingen dækning 6 Delvis dækning 7 Opkaldsfejl pr. selskab 8 Opkaldsfejl pr. telefon
Læs mereMadkulturen - Madindeks 2015 69. Rammer for danskernes måltider
Madkulturen - Madindeks 2015 69 4. Rammer for danskernes måltider 70 Madkulturen - Madindeks 2015 4. Rammer for danskernes måltider Dette kapitel handler om rammerne for danskernes måltider hvem de spiser
Læs mereEvaluering af Soltimer
DANMARKS METEOROLOGISKE INSTITUT TEKNISK RAPPORT 01-16 Evaluering af Soltimer Maja Kjørup Nielsen Juni 2001 København 2001 ISSN 0906-897X (Online 1399-1388) Indholdsfortegnelse Indledning... 1 Beregning
Læs mereTietgenskolen - Nørrehus. Data warehouse. Database for udviklere. Thor Harloff Lynggaard DM08125
Tietgenskolen - Nørrehus Data warehouse Database for udviklere Thor Harloff Lynggaard DM08125 Juni 2010 Indhold Beskrivelse... 3 Data warehouse... 3 Generelt... 3 Sammenligning... 3 Gode sider ved DW...
Læs mereAnalyseinstitut for Forskning
Analyseinstitut for Forskning Den danske brugerundersøgelse i forbindelse med en eventuel etablering af selvstændig Nordisk Forskningsstatistik Notat 2003/2 Analyseinstitut for Forskning The Danish Institute
Læs mereTHOMAS KAAS (UCC & AU, DPU), WEBINAR, 31. JANUAR, 2018
THOMAS KAAS (UCC & AU, DPU), WEBINAR, 31. JANUAR, 2018 Hvad er algebra i grundskolen, og hvorfor er det svært? Hvad er tidlig algebra, og hvorfor skulle det hjælpe? Undervisning med tidlig algebra hvad
Læs mereBørn, unge og alkohol 1997-2002
Børn, unge og alkohol 1997-22 Indledning 3 I. Alder for børn og unges alkoholdebut (kun 22) 4 II. Har man nogensinde været fuld? III. Drukket alkohol den seneste måned 6 IV. Drukket fem eller flere genstande
Læs mere