Digitale Videnssystemer: Notater



Relaterede dokumenter
Bringe taksonomier i spil

Afsnittet er temmelig teoretisk. Er du mere til det praktiske, går du blot til det næste afsnit.

Alle dokumenter der oprettes på en sag i GE på fanen Dokument gemmes i mappen for den pågældende sagstype.

Roskilde Tekniske Gymnasium. Eksamensprojekt. Programmering C niveau

Skrivevejledning for Kulturstudier juli 2017

Notat om metadata om grunddata

Fremstilling af digitalt undervisningsmateriale

Portfolio Andreas Stjerneklar Kristensen. Multimedia Designer Eksamen 1. Semester

Vejledning i skabelse og test af metadata

Om at konvertere PDF - den gode, den dårlige og den forfærdelige metode

Lav dine egne hjemmesider/websider

Kvalitetssikring Medieprodukt

PHP Quick Teknisk Ordbog

Når du udstiller dine data

Guide til quizværktøj

World Wide Web Det verdensomspændende spindelvæv Søgemaskinerne Portal eller fritekst Viggo Liebmann Hansen

LaserNet v6.6 Release Nyhedsbrev

Portfolio-opgave 1: Informationsarkitekturer i LIS

Acceleration af Kollisionsdetektion på Parallelle Computerarkitekturer

Namespaces. Vi kan kvalificere elementer på denne måde: <?xml version="1.0" encoding="iso "?>

Grundlæggende HTML. Hjemmesider, kommunikation og kode. mandag den 13. august 12

Svensk model for bibliometri i et norsk og dansk perspektiv

LinkGRC. Dokumenter. Brugermanual

Webside score windowsrepublic.com.au

UDVIDET FORÆLDRESAMARBEJDE

Indhold Indhold... 1 Upload fil... 2 Skift sektion... 2 Rediger menu... 2 Planlæg udgivelse... 3 Opret side... 3 Opret nyhed... 3 Opret galleri...

Vejledning til Projektopgave. Akademiuddannelsen i projektstyring

Som bruger af Mendeley kan man komme ud for, at de poster man downloader skal rettes en smule til.

Tekniske informationer til forfattere

Opmog opm- om HTML og XML

TravelTales; håndtering af konfigurationsfil

ARBEJDE MED ÆNDRINGSSTYRING LibreOffice

Udvikling i vidensorganisation indenfor musik, herunder folksonomier nu deler vi alting

Ekstern evaluering af Makroøkonomi 2 Langt sigt Forelæsninger, efterår 2003 Underviser: Hans Jørgen Whitta-Jacobsen

It og informationssøgning Forelæsning november 2006 Jakob Grue Simonsen. Hypertekst og Python. Andersen & Simonsen: kap. 12

Undervisningsbeskrivelse

Forskningsnyheder om Huntingtons Sygdom På hverdagssprog Skrevet af forskere. Til det globale HS-fællesskab Ofte stillede spørgsmål, januar 2011

Oplyser vejen: En ny biomarkør for Huntingtons Sygdom

Emmas og Frederiks nye værelser - maling eller tapet?

Det. Bind. Journal of. Citations. Impact Factor. Articles. Books. Patents

KOLLEKTIV VIDEN OG DIGITAL DATADREVET INDDRAGELSE I DET OFFENTLIGE

Zotero er et smart værktøj til at få styr på dine referencer og litteraturlister. Zotero er gratis og på dansk.

mailinglister i Revimentor

Større skriftlige opgaver i Microsoft Word 2007 Indhold

EN VEJLEDNING FRA UCL BIBLIOTEKET. Zotero. version 5

SUP-specifikation, version 2.0. Bilag 14. SUP-Styregruppen. Ordliste (informativ) Udkast af 12. juni Udarbejdet for

- A) Overskrift Hvis du ikke kan finde på en oplagt overskrift lige nu, så skriv bare et eller andet. Du kan redigere i det senere:

Webside score cozytime.ca

Heldigvis har systemet indbygget en hjælp, som man kan benytte, hvis denne vejledning ikke berører det opståede problem.

TEX og L A TEX TEX: system (program) til typografisk opsætning af dokumenter med højt indhold af matematik. På computer, og i høj typografisk kvalitet

Modul 16, Word 5 Felter, tabeller og breve

Hassansalem.dk/delpin User: admin Pass: admin BACKEND

Lærer nye styresystemer Installerer programmer som kun kan bruges i ældre versioner

Indhold Login flexsignage... 1 Rediger eksisterende layout... 1 Oprette et layout - template... 1 Oprette et layout tomt... 2 Designe layout...

ABM standard arbejdsgruppen nedsat af Statens Arkiver, Biblioteksstyrelsen og Kulturarvsstyrelsen

Talforståelse undersøgt fra et kognitivt perspektiv

- 1) Overskrift Hvis du ikke kan finde på en oplagt overskrift lige nu, så skriv bare et eller andet. Du kan redigere i det senere:

Når du har medie filer i dit system vil det blive fremvist i de forskellige medie fremvisere afhængig af hvordan du type bestemmer og beliggenheden

Forslag til oprettelse af et konferencemodul

Installationen af Designskabelonerne gøres ved at installere henholdsvis et lille program samt en række skrifttyper som bruges af skabelonerne.

DAVAR Omdøbt til SagDokumentFormat. Attention er skilt ud i et selvstændigt format, AttentionFormat.

Anklagemyndighedens Vidensbase

Mendeley: IMPORT AF REFERENCER

For at logge ind i PURE, skal du gå til siden medarbejdere.au.dk/pure. Tryk på det blå loginfelt i højre side.

Artikel om... Digital signatur. OpenOffice.org

Opgaveteknisk vejledning Word 2011 til Mac. Tornbjerg Gymnasium 10. december 2015

arkiver, biblioteker og museer på internettet

adfgvrga Open Access Hvor og Hvordan Steen Ammentorp

1. SCREENING OG BAGGRUND

Udgivelsen er beskyttet af Creative Commons license, Navngivning 2.5

Zotero. En praktisk guide - sådan henter du referencer - sådan redigerer du referencer - sådan indsætter du referencer i Word

Sitecore - basisvejledning Version 2. September 2010

BEDSTE BOLIGORGANISATION PÅ NETTET KRITERIER: NAVIGATION

Forskning med brug af tekster og tekstværktøjer

Webside score dictionary.com

Database kursus Forår 2013

Notat om Curriculum modul til Pure

Online billede filtrering

KORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER

Guide. Administration af FDF.dk/Nyborg. 1. Udgave Ide og layout Christoffer S. Rasmussen

Proteinfoldning og chaperoner

Artikel om... Combo Box i Calc. OpenOffice.org

Vejledning til opgraderet version af Danmarks Arealinformation

Modul 2 - Computerens drev og tekstbehandling. Computerens netværksdrev og mappen dokumenter

I denne manual kan du finde en hurtig introduktion til hvordan du:

Opgaveteknisk vejledning Word 2016 til Mac. Tornbjerg Gymnasium 10. december 2015

Hvad er et digitalt medie?

Webside score downvid.co

SOCIALE KOMPETENCER. Side 1 af 13 LÆRINGSOMRÅDE: EMPATI

Tema på din ipad

OBJECT IDENTIFICERES OID PHMR

Byggeriets Evaluerings Center

Erfaringer med Information Management. Charlottehaven Jens Nørgaard, NNIT A/S

VEJE TIL VIDEN VIDEN

Uniq.Survey-Xact.DK. Vejledning. Rambøll Management Olof Palmes Allé 20 DK-8200 Århus N Denmark. Tlf:

Oversigt over vigtige felter i en kildeangivelse.

Dette er et uddrag fra: Lis og Torben Pøhler: "Hu Hej - Vild med dyr" - en læsevejledning Maaholms Forlag 2000.

Den genetiske 'gråzone' i Huntington's chorea: hvad betyder det alt sammen? Den basale genetik

Transkript:

Digitale Videnssystemer: Notater Sigfred Hyveled Nielsen IVA / Københavns Universitet 3. Semester Denne tekst er skrevet af Sigfred Nielsen, og stillet til rådighed under Creative Commons Navngivelse-IkkeKommerciel-DelPåSammeVilkår 3.0 Unported licensen. http://creativecommons.org/licenses/by-nc-sa/3.0/

Digitale Videnssystemer: Notater 0: Indhold Indhold Indhold 2 1 Notater fra undervisning 3 1.1 Markup og XML................................. 3 1.1.1 SGML................................... 3 1.1.2 XML................................... 3 1.2 Metadata..................................... 4 1.2.1 Metadata vs deskriptive data..................... 4 1.2.2 Standarder................................ 4 1.3 Billedindexering................................. 5 1.4 Lydindexering.................................. 5 1.5 Bibliometri 1................................... 5 1.5.1 PURE................................... 5 2

1 Notater fra undervisning 1.1 Markup og XML Al tegnsætning og lign. er markup. Et symbol-syntax, som er forståeligt for både skriver og læser. Vi læser ikke Markup vi fortolker. Typer af markup: Tegnsætningsmarkup: det vi bruger i skriftsproget, og lærer som børn i skolen. Præsentationsmarkup: tilføjes automatisk i word processors (sidetal/kursiv) kun ved WYSIWYG!!! Proceduremarkup: TeX, PostScript, etc. Referentiel markup: link, fodnote, henvisning... Metamarkup: Markup af metadata titel, forfatter... Deskriptiv markup: bruges i XML. Fortæller hvad der er, hvor andre typer primært angiver hvordan det skal se ud. Nogle typer markup egnet til læsning af mennesker, andre egnet til maskinel behandling. 1.1.1 SGML Standard Generalized Markup Language. Ophav til XML. En universel standard gør data brugbare på tværs af grænser, kan behandles uhæmmet. SGML er ikke i sig selv et markup sprog, har ikke et syntax. En ramme. HTML er et SGML. 1.1.2 XML XML skabt for at reducere SGML. Man kan lave egne tags i HTML kan man blot angive noget som italic, hvor XML kan angive som quote. XML er opbygget i et træ, med Parent og Child nodes. Det er hierakisk, og tag-sæt kan ikke overlappe (du kan ikke sige på tværs af ). Understøtter også attributter: Alt dette gør, at man kan transformere dataene på mange forskellige måder. Med transformering kan man opsætte regler, der fx gør at alt med tagget titel markeres med fede typer. Man kan i og for sig hver især definere sine egne XML tags, men så kan man ikke nødvendigvis bruge andres. Derfor søger man at definere standarder for tagging. 3

1.2 Metadata Metadata er struktureret information, der beskriver ressourcen - dataene. I gamle dage var det på biblioteket kartotekskort hvad der idag er overført til digitale databaser. Typer: Administrative metadata Strukturerede metadata (så res. kan findes igen, fx format) Deskriptive metadata beskriver ressource Kan opstilles i forskellige formater (simpel, struktureret, rig). Forskel ligger primært i hvordan de indsamles automatisk, manuelt,... 1.2.1 Metadata vs deskriptive data Deskriptive data =/= deskriptive METAdata. Deskriptive data er i dokumentet, ofter tilføjet af forskere. Fx når historikere anmærker at en del af en tekst er gået tabt. 1.2.2 Standarder De forskellige typer data og metadata er underlagt diverse standarder, fx: Dublin Core: 15 grundelementer i metadata-opsætning. Struktureret format. MARC (i Danmark i udgaven danmarc2). Biblioteksformat. Er ved at miste grund til en mere XML-baseret udgave. TEI: giver mulighed for at redigere og analysere texter, baseret i XML-retningslinierne (og TEI er mere retningslinie end standard). Kan bruges til både metadate og deskriptive data. Bruges meget i forskningsøjemed. Interoperabilitet: gør at man kan udveklse data mellem forskellige standarder. Kan være problematisk hvor sætter man ting lig hinanden? Flexibilitet: i hvilken grad man selv vælger, hvad man bruger af standarden. Skal alle felter/tags anvendes? Hvor meget standarden kan tilpasses den konkrete brug. Extensibilitet: hvor meget man selv kan udvide standarden med egen markup. Fx hvis TEI ikke har tags for matematiske formler så kan man bruge MathML s tags, og dermed bruge to standarder samtidig. Problemet er at det går ud over interoperabiliteten jo mere specifikt det er, jo sværere er det at bruge bredt. 4

Det kan også være problematisk, hvis man bruger de samme tags, men mener noget forskelligt med dem. Fx hvis nogen har brugt et tag, fordi de ledte efter ikke allerede findes. 1.3 Billedindexering KILDE: Lancaster, kap.13 Det er svært at indexere ikke-text objekter. Subjektivitet, følelser Billeder skal fortolkes, en text skal læses. Perspektiv er en faktor. Specificitet/detaljegrad. Konceptbaseret indexering Vi genkender elementer på billeder fx at det forestiller en bestemt person (high level features). Indholdsbaseret indexering De basale medfødte egenskaber af billedet, fx farver og former (low level features). Der er lag i billedbeskrivelser (se slideshow), der tæller som stigende niveauer af specificitet, nøjagtighed, abstraktion. Disse bliver gradvist sværere at gøre maskinelt en maskine kan genkende at det er et billede, farver og mønstre men hvad billedet forestiller er en menneskelig opgave (indtil algoritmerne bliver bedre). I en abstrakt forstand kan billedet være AF eller OM af et menneske, eller om fattigdom. Hvad det er af kan vise hvad det er om et skelet kan betyde død. Her bliver det straks sværere at gøre det maskinelt. 1.4 Lydindexering Længere væk fra text end billeder, men kan indeholde tale der kan transkriberes til skrift og søges i. Men musik og lyde er sværere for en maskine at lægge ret meget i. 1.5 Bibliometri 1 1.5.1 PURE System man bruger til at registrere publikationer (opfundet i Danmark). Opererer med et pointsystem, alt efter hvad der skrives. Forskere får kun point for nogle typer (ikke fx avisartikler), og disse udløser penge. En entry har et status felt. 5

Der måles på antal af forfattere, og deres ansættelsessted. 6