Forskning med brug af tekster og tekstværktøjer

Relaterede dokumenter
CLARIN-DK Status. info.clarin.dk. Bente Maegaard. National Coordinator Vice Executive Director

Humanistiske forskningsinfrastrukturer aktiviteter i DIGHUMLAB

DIGITAL HUMANIORA CAFE. 20. April 2015

CLARIN en europæisk forskningsinfrastruktur

Brugerundersøgelse tilgængelige data og brugerbehov

Notat om rebudgettering, Pædagogik og formidlingstiltag Oktober 2015

DANSK DANish helpdesk

Forskning med brug af audiovisuelt materiale især radio

Klargøring af tekstresurser til deponering i CLARIN-DK

DK CLARIN: METADATA FOR WP4 RESSOURCER

DeIC Danish e-infrastructure Cooperation

Aktivitetsrapport fra DIGHUMLAB s projektledergruppe og temaerne

Open Science, open access, open data - Rigsarkivet som aktør indenfor e-science

Center for Sprogteknologi 25 år

Anvendelse af digitale ressourcer i dansk forskning!

Center for Internationalisering og Parallelsproglighed (CIP)

Politik for adgang til de digitale samlinger

Velkommen til Gå-hjem-møde om Statistisk baseret automatisk oversættelse. 18. April 2012 Center for Sprogteknologi Københavns Universitet

MUDS okt Hanne Ruus. Fri og bunden forskning om CLARIN-DK WP 2.3 Knowledge for everyman. Institut for Nordiske Studier og Sprogvidenskab

DIGHUMLAB tema 3 Big Video udfordringer og muligheder

Strategi for Digital Arts Initiative

Strategisk brug af Sociale Medier. 9. maj 2011 Trine-Maria Kristensen

Streaming video på højere uddannelsesinstitutioner

adfgvrga Open Access Hvor og Hvordan Steen Ammentorp

DIGITAL HUMANIORA HVAD ER DET? FORSKNINGENS BEHOV FOR DIGITAL INFRASTRUKTUR, MED INTERNETTET SOM EKSEMPEL

Larm Case Data Management Plan

STRATEGI #meretilflere

Statusrapport om forskningsinfrastruktur og forskningsinfrastrukturlignende

Nationalmuseets arktiske og nordatlantiske strategi for perioden

Koncern-IT. KU Digital. Københavns Universitets digitaliseringsstrategi. Westergaard IT-strategi Dias 1

Dansk sproghistorie 1

DeIC strategi

Brug af CLARIN s værktøjer til at skabe AcaDan, et korpus for dansk akademisk sprog

Projektkald for udmøntning af DEFF-puljen i 2014

Hvem er vi? Dorte Warberg Wittus - dw@bib.sdu.dk. Kurt Bilde kub@sdu.dk. Bibliotekar på Syddansk Universitets Bibliotek, Odense

Digital Eksamen Når du er logget ind i Digital Eksamen, bliver du mødt med en oversigt som vist nedenfor:

Oversigt over vigtige felter i en kildeangivelse.

Som forskningsinstitution forsker Statsbiblioteket i information og medier.

9. semester, Humanistisk Informatik, Interaktive digitale medier, Aalborg Besvaret af: med nogle svar

KORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER

Folkebibliotekernes adgang til Kulturarven på Det Kgl. Bibliotek. juni 2018

Undersøgelse af det danske webdomæne

National strategi for Datamanagement

Retningsliner for etwinning værktøjer

Professionshøjskolen Metropol, NCE. Blog om læreproces. Med WordPress.com

BIBLIOTEKETS ROLLE INDEN FOR DIGITAL HUMANIORA. OPSAMLING AF SKRIFTLIGT OUTPUT FRA SEMINARET

Studenterportalen. Registrering og upload af bacheloropgaver og andre afgangsprojekter. Professionshøjskolen Metropol, marts 2011

Skema til høringssvar anmeldelse af forskningsdata

Aarhus University Library - snitflader til Statsbiblioteket

Larm Case Data Management Plan

Hvad er en bachelor?

1. Økonomisk ramme Der er for aftaleperioden aftalt følgende økonomiske rammer for biblioteket:

Digitale Videnssystemer: Notater

Bilag 6.1 SYDDANSK UNIVERSITET / ONLINE STRATEGI. Vision: Scenarier

Mendeley kan hjælpe dig med at organisere din forskning og samarbejde med andre online.

KUBIS Strategi

Styregruppen*for*National*Data*Management*

Kravspecifikation. for. Indholdskanalen 2.0

Shared space - mellem vision og realitet. - Lyngby Idrætsby som case

Anklagemyndighedens Vidensbase

AALBORG SYGEHUS MEDICINSK BIBLIOTEK. Kursuskatalog. Kurser i informationssøgning og referencehåndtering

Efter- og videreuddannelse. - gør viden til værdi

Handlingsplan

Avisdigitalisering. Fjernlånsmøde 12. november Tonny Skovgård Jensen Tonny Skovgård Jensen

Tilvalg i Polsk for begyndere

Center for Internationalisering og Parallelsproglighed (CIP)

Mendeley er både en reference manager og et akademisk socialt netværk.

Manuskriptvejledning De Studerendes Pris

DeIC escience komité møde

Rådets konklusioner om digitalisering og onlineadgang til kulturelt materiale og digital bevaring

a d e m i e t Program for foråret 2011 Akademiet for Talentfulde Unge

DIGHUMLAB IDENTIFICATION OF SERVICES AND RESPONSIBILITIES

Interaktiv filmanalyse

US AARH. Generelle oplysninger. Studie på Aarhus Universitet: Engelsk, Bachelor. Navn på universitet i udlandet: Aberystwyth University

Nye forskningsresultater om den skriftlige sprogbrug i uddannelsessektoren

Arktisk Aldring( AgeArc) Livsvilkår, livskvalitet og sundhedsfremme blandt ældre i Grønland

at understøtte åbne og inklusive uddannelser i samarbejde med nationale og internationale

Sprogteknologi I Undervisningsplan Forårssemester 2008

Statsbibliotekets. Politik for digital bevaring

August Succesindikatorer. Ed. Birte Christensen-Dalsgaard DIGHUMLAB Draft version august, 2016

KirPACS undervisning Oktober

Manuskriptvejledning pr Bachelorprisen

Præsentation af OPEN og demonstration af REDCap

Skema til høringssvar anmeldelse af forskningsdata

Indstilling til Direktionen

PDF/A. PDF/A for AFP-Brugergruppen. den 11. maj 2011 Sørup Herregård

10 Dogmeregler - inspiration til gentænkning af forelæsningsformen. Ved Peer Vestergaard Pedersen Professionshøjskolen Metropol pvpe@phmetropol.

Forskers behov for Data Services

Digitale samlinger fra Det Kgl. Bibliotek

INNOVATION. BLOGS. KU. DK

DIGHUMLAB DESCRIPTION OF COMPONENTS

Strategi 2016 på HUM: Ramme med udvalgte indsatsområder

Oversigt over vigtige felter i en kildeangivelse.

KirPACS undervisning Marts

Vejledning: Søg og bestil i katalogen

DeIC escience komité møde

Undersøgelse af studiemiljø på Det Humanistiske Fakultet, Københavns Universitet

Bringe taksonomier i spil

Sociale Medier eguide. Hvem rammer vi bedst hvor? Hvordan er medierne forskellige? Hvad skal vi producere af indhold? og med hvilket formål?

Transkript:

Forskning med brug af tekster og tekstværktøjer Lene Offersgaard, Center for Sprogteknologi, NFI, KU leneo@hum.ku.dk KU, 20. april 2015

DIGHUMLAB har tre søjler: Language-based materials and tools Research infrastructure for the study of internet materials Interaction and Design Studies Partnere i denne søjle: Det Kongelige Bibliotek CST, NFI på KU 20. april 2015

CLARIN ERIC Conference 2012 DIGHUMLAB Clarin.dk

CLARIN.DK s mission: Facilitere brug, deling og bevaring af sprogbaserede digitale forskningsdata Tilgængeliggøre værktøjer og udvikle nye services i samarbejde med forskere Fremme digitale metoder i humanistisk forskning gennem møder, workshops, helpdesk mv. Drive et datacenter, hvor forskningsdata kan bruges, deles og bevares. 20. april 2015

CLARIN.DK en forskningsinfrastruktur Forankret på Københavns Universitet, men skal servicere forskere fra hele Danmark Fortsættelse af det nationale projekt DK-CLARIN 2008-2011, som samlede sprogresurser af forskellige typer DK-CLARIN var et samarbejde mellem Det Kongelige Bibliotek, Det Danske Sprognævn, Det Danske Litteraturselskab, Johannes V. Jensen Centret, AU, Nationalmuseet, samt INSS og CST på KUA. De tre søjler i CLARIN.DK: Datacenter Knowledge sharing Værktøjer og applikationer 20. april 2015

Resurser i repositoriet: Tekstsamlinger: 14 stk af forskellige typer, de fleste med annoteringer, i alt 40.000 tekster Heraf fremhæve: Billedsamlingen Danmark i Nyere Tid : 6800 fotos fra Nationalmuseet med beskrivende tekst (DNT) Ældre danske fagtekster fra perioden 1500 til 1750 for det almindelige publikum, 86 tekster (everyman) Lyd- og videosamlinger, samt annotationer af lyd og video Leksika 20. april 2015 Data: andre typer af data

Udvikle metadata for assyriske lertavler Lertavlerne dateres ca 1950-1700 f.kr. Tavlerne er fra det gamle Mesopotamien De er skrevet med kileskrift Ca 6.000 er blevet digitaliseret Teksterne er 10-1000 ord lange, gennemsnitslængde er ca.100 ord per tekst Samarbejde m. Thomas Hertel, ToRS om at skabe TEI-metadata for disse tekster, og gøre transkriptionen af kileskriften søgbar 20. april 2015

Søgning efter resurser vha. metadata Metadata beskriver resursen Metadata bruges i søgning DIGHUMLAB Clarin.dk Alle resurser har tilknyttet metadata, fx. titel, forfatter, årstal, beskrivelse, emne Nogle metadata deles af alle resurser, fx. Titel, beskrivelse, format En del metadata er resurse-specifikke: Information om den trykte bog, tekstens afsender/modtager Metadata er baseret på standarder: TEI, CMDI, IMDI, OLAC/Dublin Core Resurser valideres ved import for at sikre format og metadata kan håndteres af repositoriet 20. april 2015

20. april 2015 DIGHUMLAB Clarin.dk

6. feb.2015 DIGHUMLAB Clarin.dk

6. feb.2015 DIGHUMLAB Clarin.dk

Korpus-søgning i folkeviser Folkeviser fra 1553-1700 Både med den originale skrivemåde fra renæssancen og med transkription på moderne dansk, se mere på duds.nordisk.ku.dk 6. feb.2015

20. april.2015 DIGHUMLAB Clarin.dk

Kurv til download og til annotering af resurser Læg først resurser i kurven fra en søgning... Så kan du vælge Download eller Værktøjskasse 6. feb.2015

Annotere resurser Vælg hvilken annotation, der skal udføres Systemet foreslår måske flere workflows, baseret på de tilgængelige værktøjer Du vælger evt. mellem alternative workflows Du modtager de annoterede data i din mailbox når processen er færdig med (nogle) metadata... 6. feb.2015

Deponering af data Har du data du gerne vil dele med andre? Vil du gerne kunne referere til dine data online uden at linket en dag dør? Lad os hjælpe dig med at deponere dem i repositoriet! Har andre data, som du gerne vil bruge? Spørg om de vil deponere dem i clarin.dk? Deponering i gang nu: Johannes V. Jensen: 43 værker fra Jensen Online 20. april 2015

Knowledge Sharing & Helpdesk Helpdesken har tre fokusområder: Dansk sprogteknologi Multimodal kommunikation Anvendelse af CLARIN-DK platformen Tag kontakt og henvis gerne dine studerende til helpdesken! Knowledge Sharing Centre under opbygning: Fremme digitale metoder i humanistisk forskning Inddrage sprogteknologi til at støtte kvalitative undersøgerser mixed-methods, visualisering 20. april 2015 Nyt korpussøgeværktøj på vej:

Workshops Arrangeres ca 3 gange pr. semester Er der et område indenfor digital humaniora som du synes er interessant og hvor andre forskere måske også gerne vil være med? Vi vil gerne facilitere! Næste arrangementer: Primo maj: TEI-workshop om annotering i tekst af tekst, bl.a. noter, henvisninger Juni: annotering af tekst og den nye begrebsordbog 20. april 2015

CLARIN.EU 6. feb.2015

Europæisk samarbejde: nu 16 centre snart 18, 13 lande.. CAC2014 - Soesterberg, NL - 25 October 2014

Clarin.dk teamet: Bart Jongejan Bente Maegaard Claus Povlsen Costanza Navarretta Dorte Haltrup Hansen Hanne Fersøe Lina Henriksen Lene Offersgaard Mitchell Seaton Sussi Olsen Information: info.clarin.dk Kontakt os: info@clarin.dk 20. april 2015