Billedsøgning og brugerindeksering:

Størrelse: px
Starte visningen fra side:

Download "Billedsøgning og brugerindeksering:"

Transkript

1 D E T H U M A N I S T I S K E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Billedsøgning og brugerindeksering: En sammenligning af brugergenererede emneord og søgetermer fra online kunstfællesskabet deviantart Det Informationsvidenskabelige Akademi, Aalborg Betinna Odgaard & Lone Grip Vejleder: Susanne Ørnager Speciale, 8. august tegn

2 1. Introduktion Abstract This Master s Thesis investigates what value the user-generated keywords (tags) on deviantart (da) add, and how this value can be increased. To answer this an empirical user study is conducted to determine: 1) how many of the keywords da users add to their images are unique access points that do not duplicate the access points present in the images titles, descriptions or the users user names, 2) which types of keywords the users add and how these compare to the types of tags users add elsewhere, 3) which types of search terms users utilize when searching for images on da and how these compare to the types of search terms used for image searching in other contexts. Finally the types of keywords and the types of search terms used on da is compared in order to discuss the value of the keywords as access points and how their overall value can be improved. The study includes keywords from 237 images provided by 237 users who uploaded the images to da, as well as search terms from search queries. The queries were collected through a 30-day diary study where 45 users registered their exact search queries as they were entered in da s search fields along with contextual data. The keywords and search terms are categorized using categories based on Shatford s (1986 & 1994) image attributes for cataloging of images (subject, biographical, exemplified, relationship) and her facetted classification of the subjects of pictures. Three extra categories are added to handle the unique characteristics of the user s keywords. It is found that the da keywords to a high degree constitutes unique access points that do not duplicate the access points present in the images titles, descriptions or the users user names, and that the category distribution of keywords and search terms to some degree correspond. Generic subject terms are dominant in both keywords and search terms, but the da users utilize more terms that are specific and less that are abstract when searching than when adding keywords. The users also add fewer keywords relating to their images status and more associative keywords or keywords that are present in a work s title than they search using these terms. It is concluded that the keywords have a reasonable value as access points, although this value can be improved through changes to the da system and better guidance of the users. 1

3 1. Introduktion Ansvarsfordeling Ansvaret for afsnittene 1. Introduktion, 2. Problemformulering, 3. Specialets opbygning, 4. Begrebsafklaring, 11. Konklusion og 12. Perspektivering er fælles. Ansvaret for afsnittene 5.1. DeviantART som online kunstfællesskab, 6.1 Videnskabsteoretisk positionering, Folksonomier, tagging og brugergenerede emneord, Shatfords emnekategorier, Dataindsamling, Dataindsamling, Rekruttering af undersøgelsesdeltagere, Undersøgelsesdeltagernes demografi, 7.3. Dataanalyse, De biografiske kategorier, Forholdskategorien, Stavefejl samt alternative sammensætninger og orddelinger, 7.4. Andre kategoriseringsskemaer, 8.1. Emneord og unikke emneord på værksniveau, 8.3. Søgetermer fordelt på søgestrenge, 8.4. Søgetermer fordelt på kategorier, 8.6. Stavefejl samt alternative sammensætninger og orddelinger, Unikke emneord, Emneord fordelt på kategorier, De biografiske og eksemplificerede kategorier, Forholdskategorien, Kommunikative, Associative og Tekst i billede, Antal søgetermer per søgestreng, Emnekategorier, Emnefacetter, Forholdskategorien, Stavefejl samt alternative sammensætninger og orddelinger, 9.3. Delkonklusion og Folksonomi og deviantart tilfalder Betinna. Ansvaret for afsnittene 5.2. Metadata og søgning på deviantart, 6.2. Billedindeksering og -søgning, Billedindeksering, Billedsøgning, Shatfords billedattributter, 7. Metode, Databehandling, Udformning af logbog og instrukser, Undersøgelsesdeltagernes demografi, Databehandling, Emnekategorierne, De eksemplificerede kategorier, Andre kategorier, Dobbeltplacering af emneord, Generelle retningsliner, 7.5. Validitet og reliabilitet, 8. Resultater, 8.2. Emneord og unikke emneord fordelt på kategorier, 8.5. Brug af kategoriafgrænsning, 9. Analyse, Antal emneord per værk, Emnekategorier, Emnefacetter, Delkonklusion, 9.2. Sammenligning af søgetermer med emneord og andre søgetermer, Søgetermer og emneord fordelt på kategorier, De biografiske og eksemplificerede kategorier, Kommunikative, Associative og Tekst i billede, Værdien af emneordene på deviantart og Videre undersøgelse tilfalder Lone. 2

4 1. Introduktion Indhold 1. Introduktion Problemformulering Specialets opbygning Begrebsafklaring DeviantART DeviantART som online kunstfællesskab Metadata og søgning på deviantart Teori Videnskabsteoretisk positionering Billedindeksering og -søgning Billedindeksering Billedsøgning Folksonomier, tagging og brugergenerede emneord Shatfords billedattributter Shatfords emnekategorier Metode Brugergenererede emneord Dataindsamling Undersøgelsesdeltagernes demografi Databehandling Søgetermer Dataindsamling Udformning af logbog og instrukser Rekruttering af undersøgelsesdeltagere Undersøgelsesdeltagernes demografi Databehandling Dataanalyse

5 1. Introduktion Emnekategorierne De biografiske kategorier De eksemplificerede kategorier Forholdskategorien Andre kategorier Dobbeltplacering af emneord Stavefejl samt alternative sammensætninger og orddelinger Generelle retningsliner Andre kategoriseringsskemaer Validitet og reliabilitet Resultater Emneord og unikke emneord på værksniveau Emneord og unikke emneord fordelt på kategorier Søgetermer fordelt på søgestrenge Søgetermer fordelt på kategorier Brug af kategoriafgrænsning Stavefejl samt alternative sammensætninger og orddelinger Analyse Sammenligning af emneord med tags fra andre undersøgelser Unikke emneord Antal emneord per værk Emneord fordelt på kategorier Emnekategorier Emnefacetter De biografiske og eksemplificerede kategorier Forholdskategorien, Kommunikative, Associative og Tekst i billede Delkonklusion Sammenligning af søgetermer med emneord og andre søgetermer Antal søgetermer per søgestreng

6 1. Introduktion Søgetermer og emneord fordelt på kategorier Emnekategorier Emnefacetter De biografiske og eksemplificerede kategorier Forholdskategorien Kommunikative, Associative og Tekst i billede Stavefejl samt alternative sammensætninger og orddelinger Delkonklusion Diskussion Værdien af emneordene på deviantart Folksonomi og deviantart Videre undersøgelse Konklusion Perspektivering Litteratur- og kildefortegnelse Bilag Appendix 1: Rådata fra deviantart (første datasæt) Appendix 2: Rådata fra deviantart (andet datasæt) Appendix 3: Kategoriserede emneord fra deviantart Appendix 4: Rekrutteringsopslag fra deviantart-journal (emneord) Appendix 5: Billeder og brugeres beskrivelser fra deviantart (første datasæt) Appendix 6: Billeder og brugeres beskrivelser fra deviantart (andet datasæt) Appendix 7: Tom logbog Appendix 8: Tom logbog uden specifikation Appendix 9: Rettelsesmeddelelse Appendix 10: Rekrutteringsopslag fra deviantart-journal (søgetermer) Appendix 11: Logbogseksempel Appendix 12: Returnerede logbøger (45) Appendix 13: Kategoriserede søgetermer

7 1. Introduktion Billedsøgning og brugerindeksering: En sammenligning af brugergenererede emneord og søgetermer fra online kunstfællesskabet deviantart 1. Introduktion En af de grundlæggende forudsætninger for succesfuld billedsøgning er, at de søgeindgange, der tilføjes til billeder, matcher de søgetermer, brugerne af et givent system benytter (Choi & Hsieh- Yee, 2010, s. 272). Dette gør sig gældende både for billedsøgning i traditionelle billedsamlinger og databaser, samt på internettet generelt. Førhen blev indeksering udført af professionelle indeksører med henblik på professionelles fremsøgning af billeder på vegne af slutbrugere. Men i dag ses der med udbredelsen af internettet en praksis, hvor de mere eller mindre erfarne slutbrugere på egen hånd har mulighed for at søge i en konstant voksende mængde billeder online og samtidig selv kan bidrage til indekseringen af disse billeder i form af f.eks. tilføjelsen af tags (Enser, 2008, s ). Professionel indeksering kan tage udgangspunkt i kontrollerede vokabularer, som bruges til at sikre konsistent repræsentation af koncepter ved indeksering og til at skabe semantisk kontrol med synonymer, kvasi-synonymer, homonymer og homografer, der alle kan volde problemer ved søgning (Large, Tedd & Hartley, 1999, s. 78). Men det har dog længe stået klart, at der eksisterer en uoverensstemmelse mellem de kontrollerede vokabularer, der benyttes af professionelle indeksører til indeksering af billeder, og det sprog, som slutbrugere benytter i deres søgninger (Choi & Hsieh-Yee, 2010; Matusiak, 2006, s. 295), samt at traditionelle kontrollerede vokabularer ikke altid er tilstrækkelige i internetsammenhænge (Macgregor & McCulloch, 2006, s. 294). Eftersom den teknologiske udvikling har medført, at slutbrugere i dag interagerer med søgesystemer, uden at det er nødvendigt, at der står en professionel mediator imellem, som kan oversætte fra brugernes til systemets sprog, er denne uoverensstemmelse blevet en reel forhindring for brugerne i forhold til succesfuld billedsøgning. Kontrollerede vokabularer afspejler desuden et kunstigt skabt indekseringssprog, der ikke konstant opdateres, og vil derfor aldrig fuldt ud kunne reflektere den terminologi, der aktuelt benyttes i forhold til de emner, de dækker over (Large, Tedd & Hartley, 1999, s. 98). Denne begrænsning findes ikke på samme måde ved den brugerindeksering, der i dag finder sted online i form af f.eks. tagging, da brugerne her benytter deres eget naturlige sprog. Dog har denne form for tagging også sine begrænsninger. Når nye termer bliver en del af brugernes ordforråd kobles 6

8 1. Introduktion de f.eks. ikke til de termer, som de erstatter, hvorved billeder tagget for år tilbage vil være svære at fremsøge i de tilfælde, hvor den relevante terminologi har ændret sig i mellemtiden. Det, at brugerne i forbindelse med tagging benytter et frit indekseringssprog, medfører endvidere en mangel på den ovenfornævnte semantiske kontrol, hvilket højner sandsynligheden for støj i brugernes søgeresultater, hvorved søgningernes præcision påvirkes negativt (Macgregor & McCulloch, 2006, s. 295). Der er således fordele og ulemper ved både brugen af de traditionelle kontrollerede vokabularer og ved ukontrolleret tagging. På trods af at der både er fordele og ulemper ved tagging, er det i dag blevet udbredt, at brugere igennem tagging inddrages i indekseringen på forskellige internetbaserede kollaborative informationsplatforme, såsom Delicious, Instagram, Tumblr og Twitter, hvor brugere selv tilføjer og indekserer indholdet (Peters, 2009). Brugerindeksering er således blevet en udbredt vidensorganiserende praksis til håndtering af de store mængder indhold, der findes på denne type internetsider (Enser, 2008, s. 534; Fenza, Loia & Senatore, 2011, s. 77; Stvilia, Jörgensen & Wu, 2012). Udover at der findes et væld af sådanne kollaborative informationsplatforme, ses der også eksempler på, at brugerne får mulighed for at blive involveret i indekseringen af traditionelle billedsamlinger ved at tilføje tags til billeder, som er blevet tilgængeliggjort online (Springer et al., 2008). Der er generelt forsket meget i, hvilken værdi brugeres tags har i forhold til at augmentere traditionel billedindeksering, og der er blandt andet blevet set på forskellen mellem brugerbeskrivelser af individuelle billeder og grupper af billeder (Rorissa, 2008); forskellen mellem brugeres og professionelle indeksørers billedindeksering (Matusiak, 2006); og brugeres kvalitetskriterier for indekstermer (Stvilia, Jörgensen & Wu, 2012, s. 99). Generelt konkluderes det, at brugerindeksering kan supplere traditionel billedindeksering, men ikke erstatte den. Det er dog kun i begrænset omfang blevet undersøgt, hvorvidt de tags, som brugerne tilføjer til billeder, matcher de søgetermer, som brugerne benytter til billedsøgning. Dette er på trods af, at det er yderst vigtigt at få afklaret dette, da brugernes tags kun har reel søgemæssig værdi, hvis de matcher det, som brugerne søger på. Ransom og Rafferty (2011) sammenlignede tags fra Flickr med resultaterne af tidligere billedsøgningsstudier, som primært foregik i afgrænsede offline billedsamlinger, mens Chung og Yoon (2009) ligeledes undersøgte tags fra Flickr, som de sammenlignede med søgetermer fra en weblog-fil udtrukket i 2001 fra internetsøgemaskinen Excite. Disse to studier baserer sig således på data om søgetermer, der er af ældre dato, samtidig med at disse data ikke stammer fra samme sted, som de brugergenererede tags de sammenholdes med. Denne diskrepans er Ransom og Rafferty (2011, s. 1054) selv opmærksomme på, da de netop efterlyser undersøgelser, der sammenligner søgetermer fra billedsøgninger, der er udført af én brugergruppe, med tags, som denne brugergruppe selv har tilføjet til billeder. 7

9 1. Introduktion Det er blandt andet manglen på denne type undersøgelser, i samspil med en generel mangel på data af nyere art om slutbrugeres online billedsøgninger, der er motivationen bag dette speciale, som netop vil sammenholde søgetermer og brugergenererede emneord fra den samme brugergruppe og samme system. En oplagt case til dette formål er internetsiden deviantart, som er verdens største online kunstfællesskab med over 32 millioner registrerede brugere og mere end 290 millioner kunstværker (deviantart, 2014a; deviantart, 2014b). Yderligere vil en undersøgelse af deviantart give et indblik i brugerindeksering i en anden kontekst end Flickr, hvilket kan biddrage til at kaste lys på eventuelle forskelle på tværs af systemer og brugergrupper. I kontrast til den måde, hvorpå tags almindeligvist benyttes på kollaborative informationsplatforme, er de brugergenererede emneord på deviantart ikke synlige for andre end den bruger, der selv uploader og indekserer et givent billede. Herved søger brugerne på deviantart i blinde, da de ikke har mulighed for at vide, hvilke emneord andre brugere tilføjer. DeviantART blev lanceret i 2000, før tagging som praksis blev udbredt, og de skjulte emneord må antages blot at være et levn fra denne fortid, da der er annonceret planer om at gøre emneordene på deviantart synlige på et endnu ikke specificeret tidspunkt i fremtiden (wreckling, 2013a). Værdien af de brugergenererede emneord er dog indtil da alene bestemt af deres brugbarhed som søgeindgange, og det er derved særligt i forhold til deviantart relevant at undersøge, om typerne af brugergenererede emneord svarer til de typer søgetermer, der benyttes ved billedsøgning på siden. Derudover er det også interessant at se på, om de emneord, brugerne tilføjer, reelt set udgør søgeindgange, som ikke allerede eksisterer i form af værkernes andre søgbare metadata for derved tilsammen at kunne afdække, hvilken søgemæssig værdi emneordene tilføjer. For at undersøge dette tages der udgangspunkt i den følgende problemformulering. 8

10 2. Problemformulering 2. Problemformulering Det overordnede spørgsmål, der undersøges i denne opgave, er: Hvilken værdi tilføjer de brugergenererede emneord på deviantart, og hvordan kan denne værdi forøges? For at besvare dette tages der udgangspunkt i følgende undersøgelsesspørgsmål: - I hvor høj grad er de emneord, brugerne tilføjer til deres værker på deviantart, unikke søgeindgange i forhold til dem, der forekommer i værkernes titel, beskrivelse og i form af brugernes brugernavn? - Hvilke typer emneord tildeler brugerne på deviantart deres værker, og hvordan forholder disse sig til de typer af emneord, som brugere tilføjer til billeder andetsteds online? - Hvilke typer søgetermer benyttes til billedsøgning på deviantart, og hvordan forholder de sig til de typer søgetermer, der benyttes til billedsøgning andetsteds? Og hvordan forholder de typer af emneord, som brugerne tilføjer deres billeder på deviantart, sig til de typer søgetermer, der benyttes til billedsøgning på deviantart? 9

11 3. Specialets opbygning 3. Specialets opbygning Specialets opbygning tager sig ud som følger: For at skabe et forståelsesgrundlag for de empiriske undersøgelser, der er omdrejningspunkt for dette speciale, indledes der med en definition af centrale begreber i kapitel 4, hvorefter der i kapitel 5 redegøres for deviantart med hovedfokus på sidens formål (afsnit 5.1.), samt hvilke muligheder, brugerne har for at tilføje metadata og søge på siden (afsnit 5.2). I kapitel 6 præsenteres det teoretiske grundlag for specialet. Kapitlet indledes med en kort redegørelse for specialets videnskabsteoretiske positionering i afsnit 6.1, efterfulgt af en introduktion til billedindekseringsteori og billedsøgning i afsnit og 6.2.2, hvor der fokuseres på de problematikker, der, som resultat af billeders ikke-tekstuelle karakter, eksisterer i forhold til indeksering og søgning af billeder. I forlængelse af dette ses der i afsnit nærmere på brugergenererede emneord og folksonomi med særligt fokus på deres brug i forhold til billeder og deviantart. Dette følges i afsnit af en gennemgang af de fire overordnede billedattributter, som Shatford Layne (1994b) arbejder med i forhold til billedindeksering, som benyttes i forhold til dette speciales empiriske del. Afsnit går i dybden med Shatfords emneattribut, som er den mest komplekse af disse fire billedattributter. I kapitel 7 introduceres metoderne til indsamling, behandling og analyse af de brugergenererede emneord og søgetermer fra deviantart, og i kapitel 8 præsenteres resultaterne af disse undersøgelser. Efterfølgende benyttes kapitel 9 til at analysere og diskutere resultaterne. I afsnit 9.1. undersøges det således, i hvor høj grad de emneord, som brugerne tilføjer til deres værker på deviantart, udgør unikke søgeindgange i forhold til dem, der forekommer i titel, beskrivelse og som brugernavn. I afsnit ses der på, hvor mange emneord, brugerne på deviantart tilføjer til deres værker, og hvordan dette forholder sig til det antal tags, brugerne tilknytter billeder på Flickr. I afsnit undersøges det, hvilke typer emneord brugerne på deviantart tildeler deres værker, og hvordan disse forholder sig til de typer af emneord, som brugere tilføjer til billeder andetsteds online (primært Flickr). I afsnit ses der på, hvor mange søgetermer brugerne på deviantart benytter per søgestreng, og hvordan dette forholder sig til det antal søgetermer per søgestreng, som tidligere undersøgelser af billedsøgning har fundet. I afsnit undersøges, hvilke typer søgetermer der benyttes til billedsøgning på deviantart, og typerne af søgetermer sammenlignes med typerne af emneord fra deviantart samt resultater fra tidligere undersøgelser af billedsøgning. I afsnit ses der på antallet af stavefejl i de indsamlede emneord og søgetermer for derved at afgøre, i hvor høj grad stavefejl påvirker emneordenes søgemæssige værdi. 10

12 3. Specialets opbygning I kapitel 10 diskuteres analysens implikationer i forhold til, hvordan værdien af de brugergenererede emneord på deviantart kan forøges, hvorefter specialet afrundes med en konklusion i kapitel 11, samt en perspektivering i kapitel 12, der berører nogle af de aktuelle problematikker, der eksisterer indenfor forskningen i billedsøgning og billedindeksering. 11

13 4. Begrebsafklaring 4. Begrebsafklaring I dette speciale er det som udgangspunkt vigtigt at få defineret de følgende hovedbegreber: - Billeder: I daglig tale kan betegnelsen billede henvise til mange forskellige ting, såsom de billeder drømme tager form af og de billeder, som verbalsproglige tekster fremmaner (Ingemann, 1990). I dette speciale er det selvfølgelig ikke denne type billeder, der behandles, men derimod billeder i form af malerier, tegninger, fotografier og så videre. Det vil sige, at billeder her skal forstås som hovedsagligt todimensionelle, statiske objekter af visuel karakter. Denne definition er inspireret af Shatfords (1984, s. 14) definition af billedlige materialer (pictorial materials). - Kunstbilleder: Dette speciales definition af begrebet kunstbillede er baseret på Shatford Layne (2002, s. 9). Begrebet kunstbillede er treleddet og dækker over billeder, som er kunst, såsom digitale malerier; billeder af kunst, såsom et foto af en skulptur; samt billeder af kunst, som i sig selv er kunst, såsom et kunstnerisk foto af en katedral. - Værker: Begrebet værk skal i dette speciale forstås, som det brugerne af deviantart uploader til deres gallerier. Værker kan således både tage form af skulpturer, malerier, animationer og tekst m.m. Der ses dog i dette speciale ikke på værker af typerne litteratur og animation, men derimod kun på de typer af værker, der tager form af kunstbilleder. Af denne grund vil betegnelsen værk benyttes synonymt med billede, når disse benyttes i forhold til deviantart. Begrebet behandles nærmere i afsnit Billedattributter: I tråd med Jörgensen (1998, s. 164) defineres begrebet billedattribut i dette speciale som enhver form for træk, element eller egenskab ved et billede, der kan repræsenteres i et informationssystem. Billedattributter inkluderer perceptuelle, semantiske og følelsesmæssige attributter genereret på baggrund af kognitive, affektive eller fortolkende responser på et billede. Begrebet billedattribut behandles nærmere i afsnit Tags: Når der henvises til tags i dette speciale, henvises der til de ukontrollerede tekstuelle beskrivelser i naturligt sprog, som brugere tilføjer til indhold på internettet. Tags og tagging behandles videre i afsnit Brugergenererede emneord: Brugergenerede emneord betegner i dette speciale de ukontrollerede tekstuelle beskrivelser i naturligt sprog, som brugerne på deviantart til- 12

14 4. Begrebsafklaring føjer i keyword-feltet, når de uploader værker til deres gallerier. Dette speciales distinktion mellem tags og brugergenererede emneord forklares nærmere i afsnit Betegnelserne emneord og brugergenererede emneord vil blive benyttet synonymt, når disse benyttes i forhold til deviantart. - Søgeterm: En søgeterm skal i dette speciale forstås som en afgrænset enhed af bogstaver eller tal, der enten alene eller i kombination med andre søgetermer indgår i en søgestreng indtastet i et søgefelt af en bruger. En søgeterm kan således enten være et ord, et tal, eller en kombination af disse. - Søgestreng: En søgestreng er en eller flere søgetermer indtastet i et søgefelt i en enkelt systeminteraktion, der resulterer i visning af en resultatside (Jörgensen & Jörgensen, 2005, s. 1349). Med disse grundlæggende begreber på plads, vil næste afsnit introducere deviantart. Indledningsvist fokuseres der på deviantarts rolle som kunstfællesskab efterfulgt af en gennemgang af, hvordan brugerne kan tilføje metadata til og søge efter billeder på siden. 13

15 5. DeviantART 5. DeviantART 5.1. DeviantART som online kunstfællesskab DeviantART blev lanceret i august 2000 og er i dag platform for et globalt internetfællesskab for kunstnere og kunstinteresserede (deviantart, 2014a). Et internetfællesskab skal i denne forbindelse forstås som "[ ] a large, collectivity of voluntary members whose primary goal is member and collective welfare, whose members share a common interest, experience, or conviction and positive regard for other members, and who interact with one another and contribute to the collectivity primarily over the Net (Sproull & Arriaga, 2007, s ). Internetfællesskabet på deviantart er primært centreret omkring kunst samt skabelsen og delingen af brugernes egne værker, og med over 30 millioner registrerede brugere og mere end 279 millioner brugerskabte værker er deviantart det største fællesskab af sin art (deviantart, 2014a; deviantart, 2014b). Et internetfællesskab af deviantarts størrelse omfatter dog også mindre fællesskaber, der opstå omkring mere afgrænsede interesser (Baym, 2010, s ), såsom bestemte kunstretninger, literære værker eller en fælles kærlighed for golden retrievers. DeviantART opretholder i overensstemmelse med den amerikanske Children s Online Privacy Protection Act en aldersgrænse på 13 år (deviantart, 2014f; Marwick, Murgia-Diaz & Palfrey Jr., 2010, s ), hvilket betyder, at sidens intenderede brugergruppe omfatter alle kunstinteresserede personer over 13 år fra hele verden. Sidens brugergruppe spænder over alt fra begyndere til professionelle, og omfatter også personer, der ikke selv producerer værker. Formålet med at være medlem af deviantart varierer således fra bruger til bruger, men overordnet set bliver siden benyttet til kunstrelateret kommunikation, samarbejde og læring de enkelte brugere imellem, samt til eksponering og salg af værker (deviantart, 2014a). DeviantART fungerer derved i praksis både som kunstfællesskab og markedsplads. I forbindelse med deviantart skal værker ikke forstås alene som det, der kan forventes at findes i et traditionelt kunstmuseum. DeviantART favner bredt over både traditionel finkulturel kunst og populærkultur, hvilket falder i tråd med det, som Shatford Layne (1994a, s. 26) påpegede; at definitionen af kunstobjekter måske er på vej mod at blive bredere og mindre velafgrænset, hvorved billeder fra populærkulturen også kan være relevante. Udover at tilhøre forskellige kunstretninger og genrer fordeler værkerne på deviantart sig desuden på en bred 14

16 5. DeviantART vifte af kunstformer; fra de helt traditionelle former for billedkunst, skulpturer og kunsthåndværk, over fotografier, digitalt skabte billeder og animationer til diverse litterære værker 1, alt sammen udført med meget varierende grad af ekspertise og vision. Værkerne på deviantart udgør således ikke en traditionel kunstsamling, og organiseringen af dem kan derfor heller ikke forventes at være påvirket af de samme traditioner og diskurser, som påvirker organiseringen og klassifikationen af kunstværker indenfor den traditionelle kunstinstitution (Ørum, 2003, s. 63). I modsætning til den traditionelle kunstinstitution, hvor det er eksperter, der afgør værkernes værdi og status som kunst (Akdag Salah, 2010, s. 18; Ørum, 2003, s. 63), foregår organiseringen og vurderingen af værkernes værdi på deviantart på baggrund af brugernes egne meninger. Herigennem frigøres kunstnerne på sin vis fra den traditionelle distinktion mellem finkultur og lavkultur (Akdag Salah, 2010, s. 19). Dette bidrager dog til en anden form for magtstruktur, som i høj grad er funderet i statistik baseret på eksempelvis antal sidevisninger af brugernes profiler og værker, antal tilføjelser af værker til andre brugeres favoritter og antal kommentarer på værker. Denne type statistik reflekterer de enkelte brugeres popularitet og er synlig på deres profiler og værker (Akdag Salah, 2010, s. 17) Metadata og søgning på deviantart På deviantart er det både muligt at søge og browse i de uploadede værker, og i begge tilfælde er det muligt at afgrænse, hvilke værker der vises, via de tilgængelige kategorier fra sidens kategorihierarki. Når brugere uploader værker til deres galleri, skal de udover at tilføje titel, beskrivelse og emneord vælge den mest specifikke af de kategorier i hierarkiet, som værket passer i. Det er dog kun valg af kategoriplacering, der er påkrævet for at kunne uploade et nyt værk, og det er således muligt at finde værker på deviantart uden titel, beskrivelse og/eller emneord. Data fra titel-, beskrivelses- og emneordsfeltet er sammen med brugernavnet på den, der uploader værket, de eneste metadata, der er søgbare i en almindelig søgning på deviantart (deviantart, 2014e), og værker uden disse valgfrie metadata vil således være særdeles svære at finde frem til. De tilgængelige kategorier i deviantarts kategorihierarki er udarbejdet i samarbejde med brugerne af siden og reflekterer således deres behov og interesser (deviantart, 2014d; Elandira, 2012). Kategorierne er hierarkisk opbygget, og øverste nivieau i hierarkiet består i de fleste tilfælde af en generel kategori, der tager udgangspunkt i værkernes form, såsom Traditional Art, Artisan Crafts osv., men der er dog også flere eksempler på, at disse kategorier 1 For et mere udførligt overblik over de mange forskellige former for værker på deviantart henvises der til deviantarts fulde kategorihierarki: 15

17 5. DeviantART baserer sig på værkernes indhold eller stil fremfor form, såsom Fan Art 2 og Manga & Anime (Billede 1). De enkelte kategorier er således ikke gensidigt udelukkende, da et værk f.eks. sagtens kan høre til i både Traditional Art og Fan Art kategorierne. Hvis kategorien Fan Art vælges som udgangspunkt findes som underkategori en anden Traditional Art kategori, uden at dette dog betyder, at værkerne heri kan findes i den øverste Traditional Art kategori, og værker, som det ellers giver mening at gruppere sammen, adskilles således. Alle værker tilknyttes som nævnt en enkelt kategoriplacering ved uploadning, men det kan være svært for brugerne at vælge den mest hensigtsmæssige, hvorved dette ikke altid sker. Når der browses værker tilføjet til en bestemt kategori, er der således risiko for ikke at få vist alle værker, som er relevante for den valgte kategori. Udover det generelle, allestedsnærværende søgefelt, hvor der søges i alle værker og journalindlæg på siden, er der søgefelter tilgængelig en række forskellige undersider på deviantart. Disse søgefelter lader brugerne søge i på forhånd afgrænsede dele af deviantart alt efter, hvor de befinder sig på siden, såsom i en given brugers galleri, hvor der alene søges i denne brugers værker, eller deviantarts onlinebutik, hvor der søges i værker, der kan købes som print eller lignende gennem siden (Billede 2). DeviantART Billede 1: Øverste kategorier i deviantarts hierarki Billede 2: DeviantARTs generelle søgefelt (øverst) samt søgefelt i en brugers galleri, der afgrænser søgning til denne brugers værker 2 Med henvisning til Henry Jenkins definerer Manifold (2009, s. 257) fanart som følger: Fanart is a catchall term for any two- or three-dimensional work that copies, appropriates from, or illustrates media-produced stories and characters [ ]. Denne definition er dog en smule snæver i forhold til, hvordan kategorien Fan Art benyttes på deviantart, hvor den også omfatter kunst, der afbilleder virkelige, kendte personer. 16

18 5. DeviantART gør det endvidere muligt at benytte en række avancerede søgekoder (Billede 3), der gør det muligt for brugerne at afgrænse deres søgninger til enten værkers titel-, beskrivelses- eller emneordsfelter (deviantart, 2014e). Når der foretages søgninger på deviantart uden brug af anførselstegn omkring søgetermer opfattes de indtastede termer i søgefeltet som enkeltstående ord sat sammen med det booleske OG (deviantart, 2014e). På samme vis bliver alle de ord, der indtastes i et værks emneordsfelt, opfattet som enkeltstående emneord, selv hvis brugerne har andre intentioner (deviantart, 2014c), og rækkefølgen af ordene har således både ved søgning og indtastning i emneordsfeltet ingen betydning. Der kan maksimalt tilføjes 255 tegn i et værks emneordsfelt, og det er kun den bruger, der uploader et givent værk, der kan tilføje emneord. Det er muligt at tilføje emneord, der ikke er skrevet med det latinske alfabet (eks. arabisk, kanji, kyrillisk m.m.), men søgesystemet på deviantart kan endnu ikke håndterer dem, så de har på nuværende tidspunkt ikke nogen søgemæssig værdi (privat korrespondance med ansat fra deviantarts Devious Technology-hold, 13. marts 2014). I forhold til både søgning og browsing på deviantart er hovedparten af de muligheder, der eksisterer for rangering af de viste værker baseret på værkernes popularitet (Billede 4). Udover muligheden for at rangere resultater efter senest uploadede værker, er de eneste sorteringsmuligheder, der ikke er baseret på popularitet, Undiscovered og Way Back, hvoraf førstnævnte er baseret på en algoritme, der finder nye værker af høj kvalitet, som formentlig bliver populære (wreckling, 2013b), mens sidstnævnte giver de brugere, der har betalt for et medlemskab af siden, adgang til at se værker uploadet på bestemte datoer (lolly, 2006). Da sorteringsmulighederne på denne måde er grundet i værkernes popularitet, gør Matthew Effekten 3 sig gældende, da de populære værker (og dermed også de populære kunstnere) således får mere eksponering, hvormed de kan opnå endnu større popularitet (Akdag Salah, 2010, Billede 3: Eksempler på avancerede søgekoder fra deviantarts FAQ Billede 4: deviantarts sorteringsmuligheder 3 Matthew Effekten er det fænomen, hvor bl.a. popularitet og status forøges kumulativt, så dem, der i forvejen besidder dette, får mere, hvorved skellet mellem dem, der har, og dem, der ikke har, forøges (van de Rijt, Shor, Ward, & Skiena, 2013, s. 270). 17

19 5. DeviantART s. 17; van de Rijt, Shor, Ward, & Skiena, 2013). Tages Matthew Effekten i betragtning i sammenhæng med den store mængde af værker, der hver eneste dag tilføjes til deviantart, bliver det ekstra vigtigt for de enkelte brugere, at der er tilføjet fornuftige metadata til deres værker. Det vil sige, at værkerne skal have tilføjet metadata på en sådan måde, at de så vidt som muligt fremkommer i søgninger, hvor de er relevante, da de ellers vil drukne i mængden. Eftersom et af formålene med at brugerne uploader værker på deviantart er at opnå eksponering for deres kunst, vil mangelfulde metadata være kontraproduktiv for den enkelte bruger. Efter en kort introduktion til specialets videnskabsteoretiske positionering, vil næste kapitel derfor belyse de generelle problematikker, der eksisterer i forhold til billedindeksering. 18

20 6. Teori 6. Teori 6.1. Videnskabsteoretisk positionering Dette speciale tager udgangspunkt i den brugerorienterede tilgang til systemevaluering. I den brugerorienterede tilgang evalueres et system på baggrund af brugernes reelle interaktioner med systemet i deres daglige liv for at opnå realistiske resultater, der kan benyttes til at optimere systemet i forhold til brugernes adfærd (Borlund, 2003). Der tages i den forbindelse afsæt i Ingwersens (2000) forståelse af brugeradfærd, hvor brugeren betragtes som værende en dynamisk variabel i og med, at brugerens omverden og kognitive tilstand medtænkes. En del af denne kognitive tilstand omfattes af ASK-hypotesen, der indebærer, at informationsbehov opstår, når en problematisk situation leder til kognitiv uvished, en såkaldt anomalous state of knowledge. Denne kognitive uvished kan få brugerne til at indse, at de har et mere eller mindre veldefineret behov for information, der er nødvendig for at kunne forlade denne tilstand (Belkin, Oddy og Brooks, 1982). Den problematiske situation kan f.eks. opstå som resultat af en work task, og des mere kompleks en sådan work task er, des sværere er det for brugerne at sætte ord på deres informationsbehov (Byström & Järvelin, 1995). Med denne tilgang kan en søgestreng ikke som i den systemorienterede tilgang anses for værende en sand repræsentation af et stabilt informationsbehov (Ingwersen, 2000). Ud fra denne position udføres der således i dette speciale en evaluering af brugeres adfærd i forhold til emneordstildeling og billedsøgning på deviantart med henblik på at opnå en indsigt i denne adfærd, der bl.a. kan bidrage til at forbedre brugerindeksering og billedsøgning på deviantart Billedindeksering og -søgning I de to næste underafsnit ses der nærmere på, hvilke særlige problematikker, der eksisterer i forhold til indeksering og søgning af billeder, med fokus på, hvordan disse relaterer sig til deviantart Billedindeksering Indeksering dækker over både deskriptiv katalogisering og emneindeksering og er den proces, hvorved der tilføjes søgeindgange til dokumenter (Informationsordbogen, 2013c), hvor dokumenter i dette tilfælde er billeder. Ved emneindeksering analyseres et dokuments indhold med henblik på udvælgelse af termer, der dækker dokumentets emne, hvorimod deskriptiv katalogisering omfatter den biografiske beskrivelse af dokumentet, der ligger udover dokumentets emne (Informationsordbogen, 2013a; Informationsordbogen, 2014). 19

21 6. Teori Grundet billedmediets visuelle karakter adskiller billedindeksering og -søgning sig fra indeksering og søgning af tekstuelle dokumenter. En af de indlysende forskelle er, at selvom billeder i visse tilfælde kan indeholde eller på anden vis have tilknyttet tekst, som indekseringen kan tage udgangspunkt i, er der ved billedindeksering grundlæggende set ikke tale om tekst, der umiddelbart kan gøres søgbar eller udtrækkes emneord fra, og søgeindgange må derfor tilføjes på anden vis (Ransom & Rafferty, 2011, s. 1038; Stvilia, Jörgensen & Wu, 2012, s. 99). Overordnet set findes der to tilgange til billedindeksering, der betegnes som henholdsvis indholdsbaseret (content based) og konceptbaseret (concept based) indeksering. Indholdsbaseret billedindeksering er indeksering af billeders basale fysiske karakteristika, såsom farver, former og teksturer. Selvom indeksering af disse indholdsbaserede attributter kan foretages manuelt, tales der oftere om automatisk indholdsbaseret indeksering, hvor computer-software identificerer og udtrækker sådanne data om billeders basale fysiske karakteristika (Matusiak, 2006, s. 285; Menard & Smithglass, 2014, s. 100). Det er indholdsbaseret billedindeksering, der bl.a. har åbnet op for muligheder såsom at bruge et billede til at søge efter andre billeder, der enten er identiske eller blot ligner, at tegne en form i et søgefelt og derved finde billeder, der indeholder tilsvarende former, eller blot at finde billeder med en bestemt dominerende farve (Menard & Smithglass, 2014, s ). Indholdsbaseret indeksering kan danne et godt grundlag til browsing, hvis brugernes informationsbehov ikke er klart definerede. Hvis brugerne derimod har mere veldefinerede informationsbehov og ønsker at finde noget konkret, såsom et billede af en solnedgang, er indholdsbaseret indeksering dog endnu ikke den optimale løsning grundet teknologiens manglende evne til at tage højde for billeders semantiske indhold (Enser, 2008, s. 537; Enser, Sandom, Hare & Lewis, 2007, s ; Menard & Smithglass, 2014, s. 101). På trods af at mange deviantart-brugere har efterspurgt muligheden for at kunne søge efter billeder baseret på deres farver, benyttes automatisk indholdsbaseret indeksering på nuværende tidspunkt ikke på deviantart, da dette vil kræve helt fundamentale ændringer i sidens søgesystem (wreckling, 2013a). Der vil således ikke blive fokuseret på automatisk indholdsbaseret billedindeksering i dette speciale, da denne tilgang på nuværende tidspunkt ikke er aktuel i forhold til deviantart. Hvor indholdsbaseret indeksering således i høj grad er en automatiseret metode, er konceptbaseret billedindeksering hovedsagligt en manuel metode, hvor en indeksør identificerer og beskriver billeders semantiske indhold og karakteristika (Matusiak, 2006, s. 285). Ved konceptbaseret indeksering er det indeksørens opgave systematisk at oversætte alle centrale aspekter og elementer af et billede fra visuelt til tekstuelt sprog (Hourihane, 2002, s. 42), så de kan gøres søgbare. Det er den manuelle tilgang til billedindeksering, der er relevant i forhold til deviantart, 20

22 6. Teori og når der i resten af dette speciale benyttes betegnelsen indeksering, henvises der således udelukkende til manuel billedindeksering, medmindre andet angives. Nogle vil påpege, at der er både filosofiske og praktiske problematikker ved at oversætte visuelt indkodet information til verbale surrogater (Enser et al., 2007, s. 466). Som eksempel påpeger Jappy (2013, s. xi), at der er [ ] an inevitable risk of distortion if we talk about images using concepts derived from the discussion of language and speech. Det er således muligt, at der går nuancer tabt, når visuelt indhold behandles sprogligt, men det er indtil videre nødvendigt at arbejde med denne form for verbale surrogater. Dette skyldes, at automatisk indholdsbaseret indeksering endnu ikke er i stand til at slå bro over den semantiske kløft, der eksisterer mellem simpliciteten af de visuelle elementer, som det er muligt at udtrække fra billeder, og den komplekse semantik, som brugerne grundet deres sociokognitive kontekst formulerer deres søgestrenge på baggrund af (Enser et al., 2007, s ). Så selvom det er udbredt, at online billedsøgemaskiner benytter automatiske indholdsbaserede teknikker, er dette endnu kun som supplement til tekstbaseret søgning (Choi, 2013, s. 1423). I den nærmeste overskuelige fremtid vil billedindeksering og billedsøgesystemer derfor være afhængige af tekstuelle annotationer, og det er således centralt at forstå naturen af billedattributter og brugeres beskrivelser af individuelle billeder og grupper af billeder (Rorissa, 2008, s. 1742). En generel praktisk problematik ved indekseringen af billeder, som skyldes billedmediets manglende tekstuelle karakter, er endvidere, at der i et billede ikke er indlejret de samme typer informationer, som der traditionelt set er at finde i tekster (Matusiak, 2006, s. 285). Et billedes ophav, hvilke materialer det er fremstillet af, hvilken størrelse en eventuel original har, eller hvilke metoder der er brugt under fremstillingen og så videre, kan således sjældent ses ud fra selve billedet. Dette er alt sammen informationer, som kan være relevante at inkludere i f.eks. et kunstværks metadata (Sundt, 2002, s ). På deviantart er det som nævnt den bruger, som selv har skabt et givent værk, der har rollen som billedindeksør. Dette har den fordel, at brugeren gerne skulle kende alle detaljer ved fremstillingen af og motivationen bag værket, hvilket gør det muligt at medtage dette ved tilføjelsen af metadata, og samtidig bliver ophavet automatisk knyttet til værket i form af brugernavn, når et værk uploades til deviantart. Men det, at kunst kan fortolkes på forskellige måder alt efter fortolker (Harpring, 2002, s. 27), betyder imidlertid, at andre søgeindgange end dem, som ophavet finder relevante, kan være nyttige i forhold til fremsøgning af et værk. Den baggrundsviden, som ophavet har, er derfor gavnlig ved tilføjelsen af metadata, men ikke nødvendigvis tilstrækkelig til en fyldestgørende indeksering. For selvom brugerne på deviantart har indgående kendskab til deres egne værker og dermed kan indeksere dem ud fra deres eget forhold til og fortolkning af dem, kan det stadig være en udfordring for brugerne at tilføje emneord, som andre 21

23 6. Teori brugere vil kunne drage nytte af ved søgning. Dette kan f.eks. skyldes manglende viden om systemet og dets brugere, eller begrænset kendskab til kunst og kultur generelt. Ligesom det er tilfældet ved indeksering af andre medietyper, kan det også selv for professionelle indeksører være en udfordring at indeksere billeder, da det bl.a. er svært at afgøre, hvilke aspekter af et billedes indhold, der er vigtige at indeksere, samt hvilket niveau af specificitet indekseringen skal foregå på (Hourihane, 2002; Matusiak, 2006, s. 286). I forhold til deviantart og kunstbilleder generelt er der desuden en ekstra dimension at tage højde for i indekseringen, da begrebet kunstbillede som nævnt dækker over både billeder, som er kunst, billeder af kunst, samt billeder af kunst, som i sig selv er kunst (Shatford Layne, 2002, s. 9). I visse tilfælde kan indekseringen af ét billede således inkludere indekseringen af mere end et kunstværk Billedsøgning Når der, som i dette speciale, tages udgangspunkt i en brugerorienteret tilgang, har den intenderede målgruppe og de søgetermer, som de benytter sig af, afgørende betydning for, hvordan indekseringen af billeder bedst foretages. I forhold til tildelingen af emneord, er det derfor vigtigt at være bevidst om brugerne og deres behov (Sundt, 2002, s. 70). Tidligere undersøgelser har set på slutbrugeres sprogbrug ved billedsøgning og sammenlignet denne med de kontrollerede vokabularer, som professionelle indeksører benytter, når de indekserer billeder. Disse undersøgelser har fundet, at selvom der er en overensstemmelse mellem de koncepter, der benyttes, eksisterer der en uoverensstemmelse mellem den terminologi, som brugerne benytter til at udtrykke disse koncepter, og den terminologi, som de kontrollerede vokabularer indeholder (Choi & Hsieh-Yee, 2010; Matusiak, 2006, s. 295). Der er kun foretaget enkelte undersøgelser, der sammenligner billedsøgninger og brugeres tags, men i disse undersøgelser stemmer de benyttede typer termer til en vis grad overens (Bischoff, Firan, Nejdl & Paiu, 2008; Chung & Yoon, 2009; Ransom & Rafferty, 2011). Ingen af disse undersøgelser har dog sammenlignet tags og søgetermer fra samme system og samme brugergruppe. Af denne grund er det interessant, at finde ud af, hvilken overensstemmelse, der eksisterer mellem de typer termer, som brugerne benytter ved indeksering af billeder i et bestemt afgrænset webmiljø, såsom deviantart eller Flickr, og de typer termer de benytter ved billedsøgning i samme webmiljø. Enser (2008, s ) konkluderer dog på baggrund af et review af tidligere studier, at omhyggeligt konstrueret metadata har mindre betydning, des længere væk et billedsøgningsscenario er fra et specialistarkivscenario, og i scenarier med uerfarne søgere får browsingfaciliteter således større betydning. Enser forklarer, hvordan denne indsigt har ledt til et voksende 22

24 6. Teori fokus på, at uerfarne søgere kan have gavn af browsing-systemer med interaktiv relevansfeedback. Dette findes på deviantart i form af sidens More Like This browsing-funktion, der er tilstede i form af ni thumbnails, når brugerne får vist et værk på siden, og som gør det muligt at browse andre kunstneres værker, der på den ene eller anden måde er relateret til det givne værk (danlev, 2012). Denne funktion er algoritmebaseret og baserer sig på, hvilken kategori et værk er uploadet til, samt hvilke samlinger af favoritter andre brugere har tilføjet værket til. I et webmiljø som deviantart, hvor brugerne har forskellig søgeerfaring, er det derved uvist, hvor stor en betydning en eventuel uoverensstemmelse i de typer termer, brugerne benytter, når de tilføjer emneord, og de typer termer, de benytter, når de søger, ville have. Det gør det dog ikke irrelevant at undersøge de typer af termer, som brugere benytter ved søgning og emneordstildeling på deviantart, hvilket bl.a. illustreres af, at 20% (18.515) af de brugere, der besvarede en poll om, hvordan de finder nye værker på deviantart, svarede, at de hovedsagligt benytter deviantarts søgefunktion, mens blot 10% (8.906) svarede, at de hovedsagligt benytter More Like This-funktionen (deviantart, 2014g). Denne poll tillod kun hver bruger at vælge én svarmulighed på trods af, at det tydeligt fremgår af brugernes kommentarer, at de enkelte brugere i høj grad benytter flere forskellige fremgangsmåder til at finde nye værker. Antallet af brugere, der benytter de enkelte fremgangsmåder, er derved formentligt meget højere. Hvor vigtigheden af omhyggeligt konstrueret metadata kan diskuteres i forhold til uerfarne brugeres billedsøgning, kan der dog ikke være tvivl om, at grundig og dækkende indeksering er vigtig for de brugere, der ønsker, at deres værker skal findes og ses af så mange som muligt. Uden omfattende indeksering risikerer disse brugere, at deres værker bliver begravet i de store mængder af værker, der findes på deviantart og på nettet generelt (Matusiak, 2006). Hele formålet med indeksering af billeder er at give adgang til enkelte billeder baseret på deres attributter og samtidig give adgang til brugbare grupperinger af billeder (Matusiak, 2006, s. 284; Laine-Hernandez & Westman, 2010, s. 1). Hvordan dette bedst gribes an, afhænger af, hvordan reelle brugere søger billeder. Af denne grund er det relevant at se nærmere på, hvad der på nuværende tidspunkt vides om brugeres billedsøgningsadfærd. Der er foretaget et begrænset antal brugerstudier i forhold til billedsøgning og brug af visuelle materialer (Beaudion, 2007b, s. 26), og de studier, der er udført, er i høj grad af ældre dato og har ofte haft modstridende resultater (eks. Armitage & Enser, 1997; Chen, 2001; Choi & Rasmussen, 2003; Hollink, Schreiber, Wielinga & Worring, 2004). Denne mangel på konsensus kan skyldes, at undersøgelserne er udført med meget forskelligartede brugergrupper og i forhold til varierende billedsamlinger (Beaudion, 2007b, s. 26). 23

25 6. Teori Der er dog overordnet set en vis enighed om, at der i traditionelle billedsamlinger i høj grad søges billeder baseret på deskriptive elementer, såsom personer, ting, steder og begivenheder afbildet, og at termer, der henviser til objekter, er de mest udbredt benyttede, mens specifikke geografiske steder ofte benyttes, og termer, der henviser til farver, former og teksturer benyttes i mindre grad (Armitage & Enser, 1997; Chen, 2001; Choi & Rasmussen, 2003; Collins, 1998; Fidel, 1997; Goodrum & Spink, 2001; Jörgensen, 1998; Westman & Oittinen, 2006). I forhold til online billedsøgning udførte Choi (2013) et brugerstudie med 29 universitetsstuderende fra et institut for medievidenskab, hvor hun undersøgte søgestrengsmodifikationsmønstre og semantiske attributter benyttet i online billedsøgninger. Gennem dette studie, der omfattede 978 søgestrenge og 1970 søgetermer fandt hun, at den mest benyttede kategori var format/genre (18,17%) og den mindst benyttede kategori var termer relateret til farver og former (1,6%). Den anden mest benyttede kategori omfattede termer relateret til organisationer eller mærkenavne (16.69%), og sammenlagt var der flest specifikke termer, færre generelle termer og meget få abstrakte termer (Choi, 2013, s. 1430). Hvor brugerstudier ikke har været udbredte i forhold til online billedsøgning, har logfilanalyser til gengæld været udbredte. Dog stammer de analyserede data i mange tilfælde fra de samme gamle logfiler fra Excite og lignende internetsøgemaskiner uden separate søgefelter til billedsøgninger (Bischoff et al, 2008; Chung & Yoon, 2009; Goodrum & Spink, 2001; Hollink, Tsikrika & de Vries, 2011; Jansen, 2008; Ozmutlu, Spink & Ozmutlu, 2003). Data benyttet i logfilstudier af online billedsøgning, er således generelt af ældre dato, og hvorvidt de konklusioner, der er draget på baggrund af dem, endnu er aktuelle, er uvist. Der ses således først nærmere på disse undersøgelser i afsnit 9.2. i analysen Folksonomier, tagging og brugergenerede emneord Billedindeksering alene via automatiske indekseringsmetoder er, som tidligere nævnt, endnu ikke den optimale løsning, og indeksering af billeder kræver derfor for nuværende menneskelig involvering, hvilket er omkostningsfuldt, hvis det skal foretages af professionelle indeksører (Matusiak, 2006, s. 287; Stvilia, Jörgensen & Wu, 2012, s. 99). Professionel indeksering er således ikke et brugbart alternativ, hvis den skal kunne omfatte de enorme mængder af billeder, der findes på internettet. Selv på afgrænsede internetsider, såsom deviantart, ophører professionel indeksering med at være en mulighed, når tilstrømningen af billeder når en kritisk masse. Siden fremkomsten af billedtagging-applikationer omkring 2004 er tagging blevet et udbredt fænomen, som har fået stor opmærksomhed i forskningslitteraturen om billedindeksering (Ransom & Rafferty, 2011, s ), hvilket blandt andet kan kobles til disse problematikker. 24

26 6. Teori Selvom der i forskningslitteraturen ikke skelnes mellem forskellige typer folksonomier, tales der hovedsagligt om tags i forhold til det, som Peters (2009) ville kalde brede folksonomier. En folksonomi består af de tags, som brugere tilføjer til indholdet på en given platform, og Peters definerer en bred folksonomi ud fra, at det ikke blot er ophavet, der kan tilføje tags til indholdet på platformen, og at det bliver registreret, hvor mange gange et bestemt tag tilføjes til det samme indhold, så det er muligt at visualisere tag-fordelinger (Peters, 2009). Det er i brede folksonomier, hvor flere brugere har mulighed for at tagge det samme indhold, at fordelene ved tagging for alvor kan høstes i form af tags, der giver udtryk for forskellige brugeres perspektiver (Peters, 2009, s. 164). DeviantART benytter ikke betegnelsen tags, men derimod betegnelsen keywords, om de deskriptive etiketter, som brugerne tilføjer til deres værker på siden. I Informationsordbogen oversættes keywords med begrebet emneord (Informationsordbogen, 2013b). Når der i dette speciale benyttes betegnelsen emneord, vil det derfor medmindre andet er angivet henvise til brugergenererede emneord fra deviantart og ikke emneord, der er resultatet af professionel indeksering. I forhold til deviantart skal de brugergenererede emneord dog i praksis ikke forstås alene som ord, der relaterer sig til et værks emne, da brugerne også frit kan tilføje termer, der rækker ud over værkets emne og henviser til andre værksattributter såsom værkstype eller ophav. Det kunne derfor argumenteres, at det ville være mere hensigtsmæssigt blot at benytte betegnelsen tags i stedet for emneord, da tags er et bredere begreb, der ikke indeholder denne begrænsning. Men dette ville blot være at bytte ét uperfekt begreb ud med et andet, da den måde, deviantart benytter de brugergenerede emneord på, og den måde som begrebet tag som oftest benyttes på i forskningslitteraturen, er vidt forskellige. Hvorvidt deviantarts brugergenererede emneord i det hele taget kan siges at udgøre en folksonomi kan nemlig diskuteres. Peters (2009, s. 165) lægger ud med at fastslå, at der som sådan ikke er tale om en folksonomi, når det sociale element ved tagging mangler, hvilket vil sige, når indhold ikke kan tagges af andre brugere end den, der tilføjer det, og når tag-fordelingen ikke kan observeres på ressourceniveau (i form af f.eks. en tag cloud tilknyttet et specifikt værk, eks. billede 5). I denne optik udgør deviantarts emneord ikke en folksonomi, da emneord på deviantart kun kan tilføjes af et givent værks ophav og endvidere ikke er synlige. De brugergenererede emneord på deviantart fungerer derfor alene som søgeindgange og ikke som indgange til browsing, hvilket ellers er en af de funktioner, der anses som værende en af de store fordele ved tagging (Peters, 2009, s. 289). 25

27 6. Teori Billede 5: Tag cloud fra LibraryThing.com tilknyttet bogen Folksonomies: Indexing and retrieval in Web 2.0 af Isabella Peters. I Peters tredelte definition af begrebet folksonomi inkluderer hun dog tilfælde såsom YouTube, der i brug af tags ligner deviantart, ved at definere det, at kun ophavet kan tilføje tags, og at disse blot er søgbare for andre brugere, som en snæver folksonomi (Peters, 2009, s. 104, ). Baseret på dette kan de brugergenererede emneord på deviantart siges at udgøre en snæver folksonomi, men det er dog uvist, hvorvidt emneordenes manglende synlighed påvirker denne konklusion, eftersom Peters ikke berører dette i hendes definition af en snæver folksonomi. Peters (2009, s. 166) påpeger blot, at det i forbindelse med tagging ofte er muligt at markere tags som private og derved gøre dem usynlige for andre, så hvorvidt emneordenes synlighed er et problem i forhold til at tale om folksonomi på deviantart er uafklaret. I forhold til at kunne fremsøge brugbare grupperinger af billeder på deviantart er det vigtigt, at der er konsistens i forhold til, hvilke emneord der benyttes, både af den enkelte bruger samt af den samlede brugergruppe. Manglende konsistens i brugen af emneord, det såkaldte vokabular-problem, forsøges traditionelt afhjulpet ved brug af et kontrolleret vokabular (Stvilia, Jörgensen & Wu, 2012, s. 100). På deviantart er der ikke tilknyttet et kontrolleret vokabular, og der er således for brugerne ingen hjælp at hente fra systemets side på dette punkt. Ulig mange tagging-systemer, eksisterer der på deviantart ej heller et såkaldt tag recommender-system, der kan give forslag til emneord baseret på den enkelte brugers tidligere benyttede emneord eller de akkumulerede emneord på siden (Peters, 2009, s. 204). Dette betyder, at brugerne ikke kan få inspiration fra hinandens emneordstildeling, og at den enkelte bruger heller ikke uden besvær kan inspireres af sin egen tidligere brug af emneord. Hermed formindskes sandsynligheden for, at brugerne tildeler emneord til deres værker på en konsistent måde (Peters, 2009, s ). 26

Query expansion med sociale tags til forbedret ranking af søgeresultater

Query expansion med sociale tags til forbedret ranking af søgeresultater Query expansion med sociale tags til forbedret ranking af søgeresultater Kandidatspeciale af Jens Peter Andersen Mikkel Just Tronhus 23. maj 2008, 31.212 ord Frederik Bajers Vej 7K 9220 Aalborg Ø Query

Læs mere

Af Daniel Honoré Pryn og Stig Krøger

Af Daniel Honoré Pryn og Stig Krøger Viden gennem tags Et mapping-analytisk perspektiv på LARM.fm Af Daniel Honoré Pryn og Stig Krøger Specialeafhandling, Det Informationsvidenskabelige Akademi, Københavns Universitet, sommer 2013 Vejledere:

Læs mere

Brugerskabte data i OPACs

Brugerskabte data i OPACs Brugerskabte data i OPACs Kandidatspeciale Danmarks Biblioteksskole Nina Holst og Tove Elisabeth Berg Årgang 2008 Vejleder Haakon Lund Afleveringsdato: 1. februar 2010 37.456 ord, 100 normalsider Abstract

Læs mere

1 INDLEDNING...4 2 BSCW...10 3 TEORI...14

1 INDLEDNING...4 2 BSCW...10 3 TEORI...14 Resume I denne rapport diskuteres forslag til redesign af BSCW således, at det bedre kan understøtte projektskrivning på RUC. Som begrebsapparat til denne diskussion anvendes begreber fra Computer Mediated

Læs mere

English abstract. We have examined the motivation for liking a Page, and have come to the following two

English abstract. We have examined the motivation for liking a Page, and have come to the following two English abstract The purpose of this Master s Thesis is to uncover how a company can take advantage of a social media like Facebook to nurture their relationships. Social Medias are not only a communicative

Læs mere

Sociale medier i virksomhedskommunikation. Speciale i kommunikation: Af: Sara Louise Barnholdt. Cand.ling.merc i engelsk og kommunikation.

Sociale medier i virksomhedskommunikation. Speciale i kommunikation: Af: Sara Louise Barnholdt. Cand.ling.merc i engelsk og kommunikation. Speciale i kommunikation: Sociale medier i virksomhedskommunikation Af: Sara Louise Barnholdt Cand.ling.merc i engelsk og kommunikation Vejleder: Henrik Køhler Simonsen Copenhagen Business School Juli

Læs mere

Udviklingsprocessen ved design af et motiverende informationssystem

Udviklingsprocessen ved design af et motiverende informationssystem Udviklingsprocessen ved design af et motiverende informationssystem Af Pernille Brandt Det Informationsvidenskabelige Akademi (IVA) Speciale, årgang 2005 Aflevering: 1. juli 2010 Vejleder: Jette Hyldegaard

Læs mere

Modul 2 projekt Marie Højlt & Anne Rosenstand Hansen D.19.12.06

Modul 2 projekt Marie Højlt & Anne Rosenstand Hansen D.19.12.06 Indholdsfortegnelse 1 Indledning og problemfelt... 4 1.1 Problemfelt... 4 1.1.1 Problemformulering... 7 2 Metode... 8 2.1 Motivation... 8 2.2 Begrebsafklaring... 8 2.3 Valg af teori...10 2.4 Empiri...11

Læs mere

- hvilke mål indgår i begrebet usability? -

- hvilke mål indgår i begrebet usability? - - hvilke mål indgår i begrebet usability? - Udarbejdet af: Rasmus Jensen & Peter Larsen Vejledt af: Morten Hertzum, Datalogi Simon Heilesen, Kommunikation Integreret speciale, Interaktive Medier Roskilde

Læs mere

Foranalyse om eksplorativ søgning

Foranalyse om eksplorativ søgning Foranalyse om eksplorativ søgning Maj 2010 Katja Guldbæk Rasmussen, Bjarne Andersson, Søren Møller, Kasper Løvschall, Jørn Thøgersen og Michael Poltorak Nielsen 1 Indhold 1. Indledning...3 2. Hvad er eksplorativ

Læs mere

Brugerinddragende design af budgetapplikation

Brugerinddragende design af budgetapplikation Roskilde Universitet Humanistisk-teknologisk bacheloruddannelse (C) Efteråret 2014 5. Semester Brugerinddragende design af budgetapplikation Gruppe B1 Aline Bartholin - 50298 Magnus Holt - 50230 Mette

Læs mere

Lene Gry Huybens Hald. Abstract

Lene Gry Huybens Hald. Abstract Abstract In this thesis: "Bing vs. Google - a measurement of the effectiveness and overlap of two search engines", the internet search engines Bing and Google are measured for their effectiveness and ability

Læs mere

En analyse af brand extension der tager udgangspunkt i eksisterende teori samt

En analyse af brand extension der tager udgangspunkt i eksisterende teori samt En analyse af brand extension der tager udgangspunkt i eksisterende teori samt Michael Dueholm og Frej Lehmann Nielsen. Kandidatafhandling 2010. udvalgt empiri, med henblik på, at opbygge brugbare værktøjer/modeller,

Læs mere

Introduktion, herunder formulering af problemområde og undersøgelsesspørgsmål.

Introduktion, herunder formulering af problemområde og undersøgelsesspørgsmål. Inholdsfortegnelse Introduktion, herunder formulering af problemområde og undersøgelsesspørgsmål....1 Problemformulering...2 Kapitel 1. Læsevejledning...3 1.2 Videnskabsteoretisk tilgang til opgaven....4

Læs mere

'5V NXOWXUDUYVSURMHNW )RUPLGOLQJ DI NXOWXUDUY JHQQHP VRFLDOH PHGLHU

'5V NXOWXUDUYVSURMHNW )RUPLGOLQJ DI NXOWXUDUY JHQQHP VRFLDOH PHGLHU '5V NXOWXUDUYVSURMHNW )RUPLGOLQJ DI NXOWXUDUY JHQQHP VRFLDOH PHGLHU 6NUHYHW DI.ODXV :LQWKHU 7KRPDV /DQGDO Abstract Today many cultural institutions are making use of social media platforms as a way to

Læs mere

M -P E J, @. V : J P H, @. P, 2007 D, K M IT-U, K

M -P E J, @. V : J P H, @. P, 2007 D, K M IT-U, K H? E M -P E J, @. V : J P H, @. P, 2007 D, K M IT-U, K I. INDHOLD II. Indledning... 5 Forbrug.dk... 5 Afgrænsning... 6 Læsevejledning... 8 III. Kortsortering kort og godt... 9 Hvad er kortsortering?...

Læs mere

En særlig tak skal også lyde til vores hovedvejleder Leif Bloch Rasmussen for stort engagement og værdifuld sparring.

En særlig tak skal også lyde til vores hovedvejleder Leif Bloch Rasmussen for stort engagement og værdifuld sparring. Abstract What is it that makes the interaction between IT and the Danish health sector so interesting? The usage of IT will become more extensive in every respect. There is rapid development in this field

Læs mere

Kommunikation på websites

Kommunikation på websites Kommunikation på websites - Vejledning i et medierighedsperspektiv Speciale ved Udarbejdet af Vejleder Hans Elbeshausen Aflevering 30. Maj 2008 Abstract I dette speciale undersøges det, i et kommunikationsperspektiv

Læs mere

OH SO SOCIAL. En undersøgelse af social cross media - tværmedial kommunikation i en social kontekst CAMILLA CHRISTIANSEN & THEA JEPSEN

OH SO SOCIAL. En undersøgelse af social cross media - tværmedial kommunikation i en social kontekst CAMILLA CHRISTIANSEN & THEA JEPSEN OH SO SOCIAL En undersøgelse af social cross media - tværmedial kommunikation i en social kontekst CAMILLA CHRISTIANSEN & THEA JEPSEN Speciale, Medieformidlet Kommunikation, Aalborg Universitet Vejleder:

Læs mere

Overforbruget og dets motiver Hvorfor vi Overforbruger

Overforbruget og dets motiver Hvorfor vi Overforbruger Overforbruget og dets motiver Hvorfor vi Overforbruger Det Samfundsvidenskabelige Basisstudium 2. Semester Sociologi & Økonomi Gruppe 24 a: Damir Pasic - studienummer 47131 Mads Lieberkind - studienummer

Læs mere

Facebook Forbrugerismens rolle på identitetsdannelsen hos unge

Facebook Forbrugerismens rolle på identitetsdannelsen hos unge Facebook Forbrugerismens rolle på identitetsdannelsen hos unge Frederik Ahlberg-Bøghave 53089 Lasse Gjerulff Petersen 52162 Rasmus Mathias Manniche 53087 Signe Mette Schrøder 53138 Simone Rebekka Rahbek

Læs mere

Netværkets opbygning... 48 KAPITEL 4 TEORIAFSNIT... 52 Indledning... 53 Baggrund og definition af strategisk kommunikation...

Netværkets opbygning... 48 KAPITEL 4 TEORIAFSNIT... 52 Indledning... 53 Baggrund og definition af strategisk kommunikation... ABSTRACT In this thesis we investigate how the circumstances for strategic or planned communication has changed as a consequence of the social semantic internet. Furthermore we seek to understand how these

Læs mere

Indhold Problemfelt... 3 Problemformulering... 5 Metodiske overvejelser... 7 Teoretisk afsæt... 7 Reliabilitet, validitet og generaliserbarhed...

Indhold Problemfelt... 3 Problemformulering... 5 Metodiske overvejelser... 7 Teoretisk afsæt... 7 Reliabilitet, validitet og generaliserbarhed... Indhold Problemfelt... 3 Problemformulering... 5 Metodiske overvejelser... 7 Teoretisk afsæt... 7 Reliabilitet, validitet og generaliserbarhed... 8 Afgrænsning... 8 Fokusgrupper som metode... 9 Informanter

Læs mere

Social Media Strategi

Social Media Strategi Social Media Strategi En empirisk undersøgelse af sociale medier, der belyser hvorfor og hvordan virksomheder skal arbejde strategisk med sociale medier Af Adil Mirzakhanova Aarhus School of Business and

Læs mere

Offentlig implementering af Digital Post for borgerne i Danmark

Offentlig implementering af Digital Post for borgerne i Danmark Offentlig implementering af Digital Post for borgerne i Danmark Forfatter: Mia Dam Samuelsen Vejleder: Per Svejvig Afleveringsdato: 2. Marts 2015 Cand.Merc.IT - Aarhus Universitet, Business and Social

Læs mere

Netto offline og online - Nanna, Sarah & Terese - IMK - Vejleder: Charlie It-Universitet 2

Netto offline og online - Nanna, Sarah & Terese - IMK - Vejleder: Charlie It-Universitet 2 Netto offline og online - Nanna, Sarah & Terese - IMK - Vejleder: Charlie It-Universitet 2 Netto offline og online - Nanna, Sarah & Terese - IMK - Vejleder: Charlie It-Universitet 3 Netto offline og online

Læs mere

Folksonomier. Brugerstyret indeksering som en del af organisationers informationsarkitektur. Af Charles Seger

Folksonomier. Brugerstyret indeksering som en del af organisationers informationsarkitektur. Af Charles Seger Folksonomier Brugerstyret indeksering som en del af organisationers informationsarkitektur Af Charles Seger Abstract Denne artikel undersøger et nyt fænomen på Internettet, der kaldes folksonomier. Ordet

Læs mere

Internetmedieret kunstformidling - en undersøgelse af brugernes oplevelse af danske kunstmuseers webformidling

Internetmedieret kunstformidling - en undersøgelse af brugernes oplevelse af danske kunstmuseers webformidling Internetmedieret kunstformidling - en undersøgelse af brugernes oplevelse af danske kunstmuseers webformidling Kandidatspeciale Ved Tenna Eliasen 20022959 Institut for Informations- og Medievidenskab Århus

Læs mere

Specialet er udarbejdet af: Anne Helene Christensen (studienr.: 2005 1254) Kristian Nørgaard Laursen (studienr.: 2005 1529)

Specialet er udarbejdet af: Anne Helene Christensen (studienr.: 2005 1254) Kristian Nørgaard Laursen (studienr.: 2005 1529) Specialet er udarbejdet af: Anne Helene Christensen (studienr.: 2005 1254) Kristian Nørgaard Laursen (studienr.: 2005 1529) Specialet er udarbejdet under vejledning af: Ph.d.-stipendiat Anne Mette Hansen

Læs mere

Agile metoder i en traditionel organisation

Agile metoder i en traditionel organisation Agile metoder i en traditionel organisation - Med dynamikken fra kulturen Specialeprojekt ved Center for IT-Ledelse, Aalborg Universitet Forfatter: Lasse Storgaard Jensen Titelblad Projekttitel: Agile

Læs mere