Søgning i databaser en sammenligning af Web of Science og Scopus. Eksamensopgave Informationssøgning og -analyse

Søgning i databaser en sammenligning af Web of Science og Scopus Eksamensopgave Informationssøgning og -analyse Det Informationsvidenskabelige Akademi Københavns Universitet Morten Hansen 2. semester 2016

Indholdsfortegnelse 1. Indledning og problemformulering...3 1.1 Indledning...3 1.2 Problemformulering...3 2. Teori...4 2.1 Søgestrategi...4 2.2 Boolske operatorer...4 2.3 Metadata, facet og facetværdi...4 2.4 Trunkering & Maskering...5 2.5 Recall & Precision...6 2.6 Hurtigsøgning...6 2.7 Bloksøgning...6 2.8 Kædesøgning...8 2.9 Citationssøgning...8 3. Metode...10 4. Analyse...11 4.1 Web of Science...11 4.1.1 Emne: Humor i Kina...13 4.2 Scopus...17 4.2.1 Emne: Humor i Kina...19 5. Sammenligning & Diskussion...22 5.1 Bloksøgning, kædesøgning og citationssøgning...22 5.1.1 Bloksøgning: Styrker & Svagheder...22 5.1.2 Kædesøgning: Styrker & Svagheder...23 5.1.3 Citationssøgning: Styrker & Svagheder...25 5.2 Web of Science og Scopus...26 6. Konklusion...27 7. Litteraturliste...29 8. Bilag...33 Bilag 1...33 2

1. Indledning og problemformulering 1.1 Indledning Web of Science og Scopus er to af de mest anvendte bibliografiske databaser i faget Informationssøgning og -analyse på Det Informationsvidenskabelige Akademi på Københavns Universitet. Som studerende tager vi disse to redskaber med os i det videre studie, og derfor er det en god idé at have kendskab til forskellene på de to databaser. Derudover vil søgestrategierne kædesøgning, bloksøgning og citationssøgning også blive en del af vores fremtidige virke, og derfor er det fornuftigt, at gå i dybden med anvendelsen af disse søgestrategier samt deres styrker og svagheder. Denne opgave vil derfor belyse ovenstående aspekter. Emnet Humor i Kina vil være udgangspunkt for anvendelse af ovenstående søgestrategier og bibliografiske databaser. 1.2 Problemformulering - Hvad er kendetegnende for de bibliografiske databaser Web of Science og Scopus? - Hvad er kendetegnende for søgestrategierne bloksøgning, kædesøgning og citationssøgning? - Hvordan kan bloksøgning, kædesøgning og citationssøgning anvendes til at identificere dokumenter om emnet Humor i Kina ved brug af Web of Science og Scopus? - Hvilke styrker og svagheder har søgestrategierne bloksøgning, kædesøgning og citationssøgning? - Er der forskel på de bibliografiske databaser Web of Science og Scopus, og i så fald hvilke? 3

2. Teori Herunder forklares teoretiske begreber. 2.1 Søgestrategi En søgestrategi er en overordnet plan for, hvordan et informationsbehov kan opfyldes eller et problem kan løses ved hjælp af informationssøgning (Harter, 1986, s.170). 2.2 Boolske operatorer Boolske operatorer er opkaldt efer George Boole (1815 1864), og der findes 3 boolske operatorer: AND, OR, NOT (Chowdhury, 2010, s. 205). Ved søgning i en database kan disse tre boolske operatorer anvendes. De boolske operatorer indsættes mellem søgeordene i en søgning. Ved en dansksproget database oversættes de boolske operatorer til OG, ELLER, IKKE Ved brug af den boolske operator AND mellem to søgeord findes resultater som både indeholder det ene søgeord og det andet søgeord (Chowdhury, 2010, s. 205). Ved brug af den boolske operator OR mellem to søgeord findes resultater som enten indeholder det ene søgeord eller det andet søgeord. Ved brug af den boolske operator NOT udelukkes resultater som indeholder det søgeord som står til højre for den boolske operator NOT (i nogle databaser, eksempelvis Scopus, anvendes operatoren AND NOT). 2.3 Metadata, facet og facetværdi Metadata er information, der beskriver en informationskildes indhold, format og/eller kendetegn (Chowdhury, 2010, s. 62). Eksempler på metadata kan være et dokuments titel, et dokuments abstract, et dokuments forfatter eller et dokuments tildelte indekseringstermer. De primære formål med metadata er at forbedre navigation og gøre det nemmere at finde dokumenter (Morville & Rosenfeld, 2007, s. 194). En facet er en uafhængig dimension med hvilken man kan klassificere et objekt (Russell-Rose & Tate, 2013, s. 168). Ved at vælge facetværdien for de enkelte facetter kan man afgrænse sin søgning, 4

eller sætte filter på søgeresultaterne, således at man filtrerer og dermed kun får vist søgeresultater med facetværdien (Russell-Rose & Tate, 2013, s. 168). 2.4 Trunkering & Maskering Trunkering kommer fra det latinske udtryk truncus som betyder stamme (Den Store Danske, 2011). Ved trunkering tages der udgangspunkt i stammen af et ord (Chowdhury, 2010, s. 220), eksempelvis abe*, og der søges hermed på alle ord der starter med abe. Ved søgning på abe* i en bibliografisk database vil dokumentrepræsentationer, der indeholder ord som aber, abefest, abekat, aberdeen etc. blive fundet. Trunkeringstegnet er typisk? eller *. Trunkeringstegnet for den enkelte database kan findes ved at se på databasens hjælpetekster, hvor det typisk vil fremgå. Trunkering kan anvendes hvis man er usikker på, hvorledes et ord staves, hvis man vil undgå problemer med sammensatte ord, hvis man vil medtage flertalsbøjninger eller hvis man vil søge bredt (Syddansk Universitetsbibliotek, 2008). Der findes både højre-trunkering, venstre-trunkering og midt-trunkering (Chowdhury, 2010, s. 220). Højre-trunkering er, når trunkeringstegnet står til højre, ligesom eksemplet ovenfor med abe*. Ved venstre-trunkering står trunkeringstegnet til venstre og stammen af et ord til sidst, eksempelvis *salat. Søgning herved kan finde kartoffelsalat, skinkesalat, råkostsalat, båndsalat etc. Midt-trunkering er, når trunkeringstegnet står mellem bogstaverne inde i ordet, eksempelvis kan det anvendes således: colo*r - hvormed søgningen medtager både color og colour (Chowdhury, 2010, s. 220). En eksakt søgning på humor (angivet med anførselstegn) vil dog kun finde resultater med ordet humor. Generelt kan det siges, at anførselstegn bruges som søgeteknik, når man vil søge efter et nøjagtigt ord eller bestemte udtryk, hvor ordene skal fremgå i en bestemt rækkefølge. Dette sker ved at sætte det pågældende ord eller udtryk i anførselstegn. Et eksempel på en maskering er en søgning på b?rn. Med denne maskering søges på dokumenter/dokumentrepræsentationer, der indeholder ordet barn eller børn eller burn eller born etc. Maskering anvendes med andre ord til at maskere et enkelt bogstav i et søgeord i forbindelse med en søgning (Chowdhury, 2010, s.220). Maskering foretages typisk ved brug af tegnet? 5

2.5 Recall & Precision Recall beskriver hvor mange relevante dokumentrepræsentationer der fremkommer ved en søgning sat i forhold til, hvor mange relevante dokumentrepræsentationer der i alt er søgbare i den pågældende database (Chowdhury, 2010, s. 99). Høj recall er kendetegnet ved, at brugeren i forbindelse med en søgning, finder alle eller næsten alle relevante dokumentrepræsentationer, som er søgbare i databasen. Precision beskriver hvor mange af de dokumentrepræsentationer, der fremkommer ved en søgning, som relevante for brugeren (Chowdhury, 2010, s. 99). Et søgeresultat med 20 dokumentrepræsentationer hvoraf 10 er relevante for brugeren er det samme som at sige, at denne søgning har en precision på 50%. Høj precision er kendetegnet ved at brugeren ved en søgning finder mange relevante dokumentrepræsentationer og få irrelevante. 2.6 Hurtigsøgning Den mest simple og direkte tilgang til søgning er hurtigsøgning ( brief search ) (Harter, 1986, s. 171). Hurtigsøgning foregår ved at søge på et ord eller to med intentionen om at finde nogle få relevante resultater. Hurtigsøgning er en hurtig måde, hvorpå en bruger kan få en føling med, hvilke poster en database rummer og kan lede brugeren til relevante indekseringstermer indenfor et givent emne. Derfor kan denne form for søgning ofte anvendes indenfor emner, som en bruger kun har sparsomt kendskab til. Hurtigsøgning vil dog have lav recall (Harter, 1986, s. 171). 2.7 Bloksøgning Søgestrategien bloksøgning ( building block search ) handler om, at søge på forskellige facetter af et emne samtidigt ved hjælp af én søgestreng. En søgestreng er den række af tegn der danner udgangspunktet for en søgning i en database eller et datamateriale (Den Danske Ordbog, u.å.). I søgestrengen anvendes boolske operatorer til at angive, at søgeresultaterne skal indeholde minimum et søgeord fra hver af facetterne. Bloksøgning tager udgangspunkt i at opdele et informationsbehov i facetter (Schlosser et al., 2006, s. 570). Antallet af facetter er typisk ikke flere end tre eller fire (Harter, 1986, s. 172). Brugeren finder søgeord og eventuelle udtryk, der kan repræsentere de enkelte facetter. Hver facet med søgeord kan betegnes som en blok, deraf navnet bloksøgning: 6

Facet A Facet B Facet C søgeord 1 søgeord 10 søgeord 20 søgeord 2 søgeord 11 søgeord 21 søgeord 3 søgeord 12 søgeord 22 søgeord 4 søgeord 13 søgeord 23 Antallet af facetter kan øges og mindskes. Søgeord kan tilføjes og fjernes ved hver facet. Søgestrategien bloksøgning bliver også kaldt den kinesiske menu indenfor informationssøgning, idet søgeresultaterne skal indeholde minimum ét søgeord fra hver facet (Harter, 1986, s.174). Et informationsbehov kan eksempelvis være: Hvorledes agerer aber i naturen? Her kan informationsbehovet opdeles i tre facetter, nemlig: aber, adfærd og naturen Der udvælges søgeord/termer til at repræsentere hver facet. Disse søgeord/termer kan stamme fra brugerens baggrundsviden om emnet og/eller findes via kædesøgning (forklares under Kædesøgning på næste side). Søgeordene/termerne kan være synonymer eller nært-beslægtede termer eller på anden måde relaterede termer, eller måske blot obskurt beslægtede termer (Harter, 1986, s. 172). Termerne for hver facet bliver opstillet i en søgestreng, hvor den boolske operator ELLER adskiller termerne. Det vil sige, at hvis et obskurt beslægtet term ikke findes ved søgning, så er der stadig andre termer i samme facet, som søgningen muligvis finder (Harter, 1986, s. 172). Termer der udvælges til at repræsenterer facetten aber kan eksempelvis være gorillaer, chimpanser, orangutanger - derudover kan aber naturligvis også indgå som term, der repræsenterer facetten. En anden facet kan omhandle adfærd og denne facet kan eksempelvis indeholde termerne adfærd, adfærdsbiologi, sociale relationer, venskab. En tredje facet kan være naturen som kan indeholde termer som naturen, jungle og navne på lande og områder, hvor aber lever i naturen. Dernæst konstrueres én søgestreng med termer fra hver facet. Hver facet kombineres med den boolske operator OG og termerne som hver facet består af separeres med den boolske operator ELLER i søgestrengen. Her er et eksempel på en sådan søgestreng: (aber ELLER gorillaer ELLER chimpanser ELLER orangutanger) OG (adfærd ELLER adfærdsbiologi ELLER sociale relationer ELLER venskab) OG (naturen ELLER jungle ELLER brasilien ELLER tanzania) 7

2.8 Kædesøgning Kædesøgning ( pearl growing ) tager udgangspunkt i et eller flere identificerede dokumenter/dokumentrepræsentationer i en database, som er relevante indenfor det emne, brugeren ønsker at finde yderligere information (Harter, 1986, s. 183; Schlosser et al., 2006, s. 572). Dokumenter og dokumentrepræsentationer vil herunder blive behandlet som synonymer. Disse identificerede dokumenter kan omtales som kernedokumenter ( pearls ). De er udgangspunktet for kædesøgningen. Og udfra disse kernedokumenter findes lignende dokumenter. Dette sker ved at undersøge, hvorledes disse kernedokumenter er indekseret i den pågældende database. Altså hvilke indekseringstermer, som er anvendt til at indeksere kernedokumenterne i databasen. Andre lignende dokumenter vil alt andet lige været indekseret på samme måde. Kernedokumenterne kan også undersøges for relevante søgeord der fremgår af andre bibliografiske metadata, såsom titel, abstract og forfatterens egne tags/emneord (Harter, 1986, s. 183). Der udvælges relevante indekseringstermer og søgeord fra kernedokumenternes bibliografiske data til at søge lignende dokumenter i den pågældende database ( growing more pearls ). Når denne søgning foretages, sker det ved bloksøgning, hvor de enkelte indekseringstermer og søgeord opstilles i facetter. Bloksøgningen kan dermed foretages, på en sådan måde at alle kernedokumenterne også vil blive genfundet udover de nye dokumenter der bliver fundet ved søgningen (Harter, 1986, s. 183; Schlosser et al., 2006, s. 571). Disse nye dokumenter undersøges for nye relevante indekseringstermer og søgeord, som tilføjes til de relevante facetter. Således fortsættes søgningen indtil, der ikke kan findes flere relevante indekseringstermer og søgeord i nyfremkomne dokumenter i den pågældende database (Schlosser et al., 2006, s. 572-573). En anden database kan dernæst undersøges for nye relevante dokumenter ved at foretage en kædesøgning heri med udgangspunkt i de samme kernedokumenter og andre relevante artikler (Schlosser et al., 2006, s. 571-572). I denne nye database kan kernedokumenterne være indekseret anderledes, og dermed være tildelt andre indekseringstermer, i forhold til den første database, der blev foretaget kædesøgning i. 2.9 Citationssøgning Citationssøgning handler, ligesom kædesøgning, om at tage udgangspunkt i et eller flere allerede kendte dokumenter. Her er det dog ikke indekseringstermerne og søgeordene der undersøges og udplukkes fra kernedokumenterne, men derimod hvilken litteratur der er henvist til i litteraturlisten - altså hvilke referencer, der har været anvendt i forbindelse med at skrive det enkelte 8

kernedokument. Ved at undersøge litteraturlisten for referencer kan brugeen opnå kendskab til relevante dokumenter som er publiceret tidligere ( ancestry search ) (Schlosser et al., 2006, s. 572). Disse tidligere publicerede dokumenter indeholder også litteraturlister, som kan undersøges for relevante referencer og på denne måde er det muligt, at finde yderligere relevante dokumenter. Det er også muligt at undersøge et kernedokuments fremtidige liv ved at finde ud af, hvilke artikler der har citeret kernedokumentet efter at det er blevet publiceret. Dette kaldes for forward citation search (Schlosser et al., 2006, s. 572) - også kaldet cited reference search (Linder et al., 2015, s. 413). Så også på denne måde kan der findes nye relevante dokumenter, der er forbundet med kernedokumentet. Derudover kan disse nye relevante dokumenter også gennemgåes for relevant materiale i deres referencer og modtagne citationer. 9

3. Metode I forhold til emnet Humor i Kina : Med Kina menes Folkerepublikken Kina, det vil sige Fastlandskina (Mainland China) samt Hong Kong, Macao og Hainan. Taiwan er også medtaget. Jeg følger dermed udenrigsministeriets retningslinjer: Danmark fører ligesom langt hovedparten af verdens lande, herunder EU-landene og USA, en ét- Kinapolitik (Udenrigsministeriet, 2010). Jeg afgrænser mig til at søge dokumentrepræsentationer af tidsskriftartikler i databaserne. Dette gøres for at holde fokus på dokumentrepræsentationer af tidsskriftartikler. Et af formålene med denne opgave er, at demonstrere og identificere relevante dokumenter. Ikke at identificere alle relevante dokumenter. En udtømmende søgning ville naturligvis inkludere alle facetværdierne for facetten Document Type, og ikke kun facetværdien Article (tidsskriftartikler). At jeg eksempelvis ikke inddrager facetværdien Book som også er at finde under facetten Document Type betyder, at graden af recall bliver mindre. Web of Science og Web of Science Core Collection anvendes som synonymer i opgaven. I analysen udleder jeg kendetegnene ved Web of Science og Scopus. Derudover vil jeg i analyseafsnittet demonstrere, hvorledes søgestrategierne bloksøgning, kædesøgning og citationssøgning kan anvendes til at opfylde et informationsbehov. Dette sker på baggrund af teorien, som jeg forklarede i ovenstående teori-afsnit. Dernæst diskuterer jeg styrker og svagheder ved de 3 anvendte søgestrategier i forhold til hinanden. Til sidst sammenligner jeg Web of Science og Scopus ved at tage udgangspunkt i analysens frembringelser. 10

4. Analyse 4.1 Web of Science Web of Science er en kommerciel abonnementsbaseret bibliografisk database på internettet, som ejes af virksomheden Thomson Reuters. I 2015 havde virksomheden et overskud på 15,3 milliarder kroner (Thomson Reuters, 2016a). Web of Science er en bibliografisk database, der kan kategoriseres som et citationsindeks eller en citationsdatabase. At det er en bibliografisk database betyder, at eksempelvis en tidsskriftartikel ikke fremgår i sin fulde længde i databasen, men derimod er repræsenteret ved en dokumentrepræsentation som indeholder metadata såsom artiklens titel,, abstract, forfatter(e), tilknyttede indekseringstermer og navn på tidsskriftet som artiklen er publiceret i. At den bibliografiske database tager form som citationsdatabase/-indeks betyder, at den enkelte tidsskriftartikels litteraturliste også fremgår, og det er dermed muligt at se, hvilke dokumenter som forfatteren/forfatterne af tidsskriftartiklen har anvendt som referencer i forbindelse med at skrive artiklen. Derudover kan man se, hvilke dokumenter som efterfølgende har citeret artiklen. Web of Science har samlet flere citationsindeks i et fælles citationsindeks som de kalder Web of Science Core Collection. Heri indgår bl.a. citationsindekserne: Science Citation Index Expanded (SCI-EXPANDED) dækker perioden fra 1900-nu (inkluderer 8.845 tidsskrifter) Social Sciences Citation Index (SSCI) dækker perioden fra 1956-nu (inkluderer 3.244 tidsskrifter) Arts & Humanities Citation Index (A&HCI) dækker perioden fra 1975-nu (inkluderer 1.778 tidsskrifter) Emerging Sources Citation Index (ESCI) dækker perioden fra 2015-nu (inkluderer 3.621 tidsskrifter) (se bilag 1; Thomson Reuters, 2016b) Pr. den 24. maj 2016 er ca. 17.500 peer-reviewed tidsskrifter inkluderet i Web of Science Core Collection (Thomson Reuters, 2016b). 11

Ialt er over 55 millioner dokumentrepræsentationer af tidsskriftartikler, konferencepapirer og bøger indeholdt i Web of Science Core Collection (Thomson Reuters, 2014, s. 1). Når et tidsskrift omtales som et peer-reviewed tidsskrift, betyder det, at artiklerne der udgives i dette tidsskrift har været igennem en peer-review proces. Her zoomer jeg for en kort bemærkning ind på peer-review processen: Når en redaktør af et tidsskrift modtager en artikel fra en forsker, som ønsker at få artiklen publiceret i det pågældende tidsskrift, så vurderer redaktøren om artiklen er passende til at kunne indgå i tidsskriftet. Hvis dette er tilfældet, så sender redaktøren artiklen ud til andre forskere som publicerer indenfor samme område og beder dem kommentere og bedømme artiklen, og give deres mening til kende om hvorvidt de mener, at artiklen bør blive publiceret, forbedret eller afvist. Og det er denne proces som bliver kaldt peer review (Sense About Science, 2011, s. 3). Herunder er et skærmbillede med et eksempel på en bibliografisk post i Web of Science Core Collection: (Web of Science, 2016a) Her fremgår metadata såsom tidsskriftartiklens titel, forfatter(e), navn på tidsskriftet som artiklen er publiceret i, abstract, emneord/tags iform af Author Keywords og KeyWords Plus, og 12

information vedrørende hvilken institution/organisation/virksomhed som forfatteren/forfatterne af artiklen er tilknyttet. Til højre fremgår antal gange som tidsskriftsartiklen efterfølgende er blevet citeret (7 citationer i ovenstående eksempel) i dokumenter som er repræsenteret i Web of Science Core Collection. Antallet af referencer fremgår også (46 referencer i ovenstående eksempel). Disse citationer og referencer er søgbare således, at det er muligt at se, hvilke 7 dokumenter der efterfølgende har citeret tidsskriftsartiklen, og hvilke 46 referencer som forfatterne af tidsskriftartiklen har anvendt i forbindelse med at skrive artiklen. Author Keywords er emneord/tags som forfatteren/forfatterne af den enkelte tidsskriftartikel har tilføjet som metadata til tidsskriftartiklen. KeyWords Plus er emneord/tags som automatisk/maskinelt er tilføjet den enkelte tidsskriftartikel, og som stammer fra titlerne på de refererede dokumenter, som tidsskriftartiklen henviser til. (Web of Science, 2016b). Der er med andre ord ikke tale om et kontrolleret vokabular, som er en liste med foretrukne termer, som anvendes i forbindelse med at tildele dokumentrepræsentationer indekseringstermer (Chowdhury, 2010, s. 155). Der lader dog til at være simple synonymringe (Morville & Rosenfeld, 2007, s. 194), hvor eksempelvis humor og humour er sat til at være synonymer, hvilket medfører, at hvis der søges på den ene term, så søges der automatisk også på den anden. 4.1.1 Emne: Humor i Kina Jeg oversætter emnet Humor i Kina til engelsk, idet jeg skal søge i en engelsksproget database. Mit udgangspunkt er en hurtigsøgning i Web of Science Core Collection på: china AND humor Formålet med denne hurtigsøgning er at finde et eller flere kernedokumenter, som jeg kan anvende som startpunkt for en kædesøgning. 48 resultater får jeg via søgningen på: china AND humor 13

(Web of Science, 2016c) Jeg afgrænser herefter resultaterne til kun at gælde en bestemt type af dokumenter, nemlig tidsskriftartikler, ved at mærkere ud for facetværdien Article under facetten Document Types i venstre side af skærmen og trykke Refine og får nu 45 dokumentrepræsentationer som resultat. Jeg udvælger nu et eller flere af de 45 fundne dokumentrepræsentationer til at være kernedokumenter. Som udgangspunkt kigger jeg på hvilke af tidsskriftartiklerne som har flest citationer og som samtidig har en relevant titel i forhold til emnet. Det viser sig, at de dokumenter med flest citationer indeholder ordene aqueous humor som tilsyneladende er en væske, der findes i det menneskelig øje. For at undgå disse irrelevante resultater foretages nu søgningen: china AND humor NOT aqueous Derefter afgrænser jeg søgeresultaterne via facetten tidsskriftartikler ( Article ). Herved får jeg 28 resultater. Jeg udvælger 3 kernedokumenter: Constructing a shared 'Hong Kong identity' in comic discourses (13 citationer) Exploration of Chinese humor: Historical review, empirical findings, and critical reflections (10 citationer) The Chinese ambivalence to humor: Views from undergraduates in Hong Kong and China (7 citationer) Jeg undersøger kernedokumenterne for relevante søgeord. Fra kernedokumentet Constructing a shared 'Hong Kong identity' in comic discourses udvælger jeg relevante søgeord fra titlen, såsom hong kong og comic - fra abstractet udvælges comedy og cantonese. Blandt emneordene er der ingen nye relevante søgeord. 14

Fra kernedokumentet Exploration of Chinese humor: Historical review, empirical findings, and critical reflections udvælger jeg følgende relevante søgeord fra titlen chinese. Ved at skimme abstractet bliver jeg opmærksom på ordet humorists og tænker, at i min kommende bloksøgning vil jeg anvende humor med højretrunkering, således: humor* for at bloksøgningen også finder dokumentrepræsentationer indeholdende ord som humorist og humorists. Fra abstractet udvælger jeg også ordene joke-telling og funny. I bloksøgningen vil joketelling fremgå med højretrunkering, således at søgeordet bliver joke* og derudover vil jeg også tilføje joking (en hurtig test viser, at det resulterer i relativt mange irrelevante dokumentrepræsentationer at trunkere til jok*). Blandt emneordene angivet af forfatteren til tidsskriftartiklen finder jeg udtrykket huaji, som betyder morsom/sjov/komisk på dansk (Google Translate, 2016a). Desuden finder jeg, via Google Translate, det kinesiske udtryk for humor, som er: youmo (2016b). Disse kinesiske udtryk vil også komme til at indgå i bloksøgningen. Fra kernedokumentet The Chinese ambivalence to humor: Views from undergraduates in Hong Kong and China finder jeg ingen nye relevante søgeord i titlen. I abstractet finder jeg ordet humorous og denne term, vil jeg allerede genfinde i den kommende bloksøgnings resultater, idet jeg anvender søgetermen humor* i bloksøgningen. Jeg finder ikke nye relevante søgeord i dette kernedokument. Jeg opstiller nu en bloksøgning med udgangspunkt i de søgeord jeg har fundet via ovenstående kædesøgning, og tilføjer desuden bynavnene for de to største byer i Kina, Shanghai og Beijing (CIA, 2015). Derudover tilføjes Taiwan. Jeg tilføjer også anførselstegn omkring hong kong for at opnå søgeresultater, hvor ordene fremgår i denne bestemte rækkefølge. Derudover tilføjer jeg det kinesiske sprog, manderin, som er beslægtet med cantonese. Jeg søger nu med følgende søgestreng: (china or chinese or hong kong or cantonese or shanghai or beijing or taiwan or mandarin) AND (humor* or joke* or joking or funny or comic or comedy or huaji or youmo) NOT aqueous - og afgrænser med facetværdien Article (tidsskriftartikler) under facetten Document Types. Dette resulterer i 594 dokumentrepræsentationer. Et kig på titlerne afslører endnu et relevant søgeord: satire - som tilføjes den kommende bloksøgning. Et beslægtet term er: parody, som derfor også tilføjes søgningen. Derudover viser det sig, at termen humoral også har indsneget sig i en væsentlig portion af 15

søgeresultaterne, hvilket skyldes højre-trunkeringen humor* Derfor tilføjes til søgestrengen i bloksøgningen: NOT humoral Jeg foretager en bloksøgning med den opdaterede søgestreng: (china or chinese or hong kong or cantonese or shanghai or beijing or taiwan or mandarin) AND (humor* or joke* or joking or funny or comic or comedy or huaji or youmo or satire or parody) NOT aqueous NOT humoral - og afgrænser igen med facetværdien Article. 233 dokumentrepræsentationer er resultatet af ovenstående bloksøgning og afgrænsning. Jeg foretager nu citationssøgning med henblik på at finde flere relevante søgeord og dokumentrepræsentationer. Jeg undersøger, hvilke dokumenter der citerer kernedokumentet: Constructing a shared 'Hong Kong identity' in comic discourses Dette gør blandt andre: From politics to comedy - A comparative analysis of affiliative audience responses og i dennes dokumentrepræsentation finder jeg frem til søgeordet laughter. Jeg trunkerer til laugh* hvilket indsættes i bloksøgningen: (china or chinese or hong kong or cantonese or shanghai or beijing or taiwan or mandarin) AND (humor* or joke* or joking or funny or comic or comedy or huaji or youmo or satire or parody or laugh*) NOT aqueous NOT humoral - og afgrænser efterfølgende resultaterne via facetværdien Article. Ved at gennemføre den ovenstående bloksøgning og afgrænsning fremfindes 273 dokumentrepræsentationer. Hermed har jeg demonstreret hvordan kædesøgning og bloksøgning kan indgå sammen med citationssøgning og skabe synergieffekt. Desuden har jeg nu ved anvendelse af søgestrategierne kædesøgning, bloksøgning og citationssøgning identificeret dokumenter om emnet Humor i Kina ved brug af Web of Science. En refleksion over de 273 fundne dokumentrepræsentationer viser enkelte false drops (Harter, 1986, s. 175), altså enkelte dokumentrepræsentationer som ikke er relevante for emnet. En dokumentrepræsentation med titlen Does political conflict hurt trade? Evidence from consumer boycotts, indeholder udtrykket Muhammad Comic Crisis i abstractet, og som handler om 16

forbrugerboykots i verden, herunder kinesiske boykotts. Fremkomsten af denne dokumentrepræsentation i søgeresultaterne skyldes søgningen på comic og chinese. Enkelte lignende false-drops kan findes blandt de 273 dokumentrepræsentationer. Eksempelvis indgår det kinesiske ord huaji åbenbart også i en traditionel medicinsk opskrift, den såkaldte Jianpi Huaji Decoction (YJHD). Kun én af de 273 dokumentrepræsentationer beskæftiger sig dog med denne medicinske opskrift. Om der er tale om en humørpille kan jeg ikke umiddelbart udlede af abstractet. Automatisk/maskinelt tildelte termer i dokumentrepræsentationerne, de såkaldte KeyWord Plus, skaber også false drops, såsom funny current som refererer til en specifik strøm i hjertet (Accili et al., 2002). Ser jeg bort fra de få false-drops, så bliver emnet Humor i Kina belyst fra flere sider i de identificerede dokumenter. Jeg kan højne graden af precision ved eksempelvis at tilføje til søgestrengen: NOT muhammad comic crisis NOT funny current Jeg skal dog passe på med at anvende den boolske operator NOT, idet jeg kan udelukke relevante dokumentrepræsentationer fra søgeresultaterne. Et eksempel kan være, hvis en relevant dokumentrepræsentation indeholder udtrykket funny current news in China. Da vil denne dokumentrepræsentation ikke blive medtaget i søgeresultaterne, såfremt jeg har tilføjet til søgestrengen: NOT funny current. Jeg kan også øge precision ved at tilføje en facet, ved at tilføje mere specifikke søgeord/termer til en facet eller ved at fjerne omfangsrige og/eller tvetydige termer fra en facet (Harter, 1986, s. 175). Jeg kan øge graden af recall ved at tilføje flere relevante søgeord til en eller flere af facetterne (Harter, 1986, s. 174). Jeg kan også øge recall ved at fjerne en facet (Harter, 1986, s. 174) - dette er dog mest hensigtsmæssigt, når der er 3 eller flere facetter i bloksøgningen. 4.2 Scopus Scopus er en kommerciel abonnementsbaseret bibliografisk database på internetttet, ejet af Elsevier som er en del af RELX Group. I 2015 havde Elsevier et overskud på 7,4 milliarder kroner (RELX Group, 2016) Scopus er engelsksproget og inkluderer over 21.500 peer-reviewed tidsskrifter indenfor områderne science, technology, medicine, social science og arts and humanities (Elsevier, 2016, s. 3). Der er over 60 millioner dokumentrepræsentationer af tidsskriftartikler, konferencepapirer og 17

bøger tilstede i databasen. Over 38 millioner af dem er nyere dokumentrepræsentationer med referencer der går tilbage til og med år 1996. De resterende over 22 millioner dokumentrepræsentationer er fra før år 1996 (Elsevier, 2016, s. 3). 80% af dokumentrepræsentationerne i Scopus bliver manuelt tildelt indekseringstermer af professionelle indeksører. Disse indekseringstermer stammer fra kontrollerede vokabularer, som Elsevier ejer eller har licens til at anvende (Elsevier, 2016, s. 12). Herunder er et skærmbillede med et eksempel på en bibliografisk post i Scopus: (Scopus, 2016a) Her fremgår metadata såsom titel, forfatter, institutionen hvor forfatteren er tilknyttet, abstract og forfatterens keywords/emneord/tags til artiklen. Derudover kan det også bemærkes, at denne dokumentrepræsentation er indekseret med indekseringstermer fra to forskellige kontrollerede vokabularer ( EMTREE og MeSH ). Til højre i skærmbilledet fremgår antal citationer, som den pågældende artikel har modtaget. Desuden fremgår antal referencer, som er anvendt til at skrive artiklen. Både citationer og referencer er søgbare, og det er således muligt at se, hvilke dokumenter der efterfølgende har citeret artiklen, og hvilke dokumenter som forfatteren/forfatterne af artiklen har benyttet sig af i forbindelse med at skrive artiklen. 18

4.2.1 Emne: Humor i Kina Jeg genfinder mine 3 kernedokumenter i Scopus ved at søge på titel: Constructing a shared 'Hong Kong identity' in comic discourses (15 citationer i Scopus) Exploration of Chinese humor: Historical review, empirical findings, and critical reflections (12 citationer i Scopus) The Chinese ambivalence to humor: Views from undergraduates in Hong Kong and China (6 citationer i Scopus) Ingen af de 3 ovenstående kernedokumenter har modtaget indekseringstermer af Scopus, som jeg eventuelt kunne føje til søgestrengen, så jeg genbruger blot søgestrengen fra søgningen i Web of Science Core Collection. Dog skal jeg være opmærksom på, at i Scopus angives den boolske operator NOT ved at skrive: AND NOT. Dermed bliver søgestrengen i Scopus som følger: (china or chinese or hong kong or cantonese or shanghai or beijing or taiwan or mandarin) AND (humor* or joke* or joking or funny or comic or comedy or huaji or youmo or satire or parody or laugh*) AND NOT aqueous AND NOT humoral Denne søgning giver 631 resultater. Jeg afgrænser herefter søgeresultaterne ved at vælge facetværdien Article under facetten Document Type - hvilket resulterer i 370 dokumentrepræsentationer. Jeg har nu ved anvendelse af søgestrategierne kædesøgning og bloksøgning identificeret dokumenter om emnet Humor i Kina ved brug af Scopus. En refleksion over de 370 fundne dokumentrepræsentationer viser, at også i Scopus fremgår falsedrops som Does political conflict hurt trade? Evidence from consumer boycotts. Det samme er gældende for dokumentrepræsentationen vedrørende den kinesiske medicinske opskrift Jianpi Huaji Decoction. Enkelte andre false drops er at finde blandt de 370 dokumentrepræsentationer i Scopus, og det må være forventeligt. Total set afspejler de fundne dokumentrepræsentationer en alsidig belysning af emnet Humor i Kina. 19

Jeg vil herunder anvende søgestrategien citationssøgning i Scopus med henblik på at identificere dokumenter om emnet Humor i Kina. Jer starter med andre ord forfra for at demonstrere, hvorledes citationssøgning kan anvendes som selvstændig søgestrategi. Jeg tager udgangspunkt i hurtigsøgningen: china AND humor som medfører 127 resultater. Jeg vælger to tidsskriftartikler som kernedokumenter. Kernedokument 1: Exploration of Chinese humor: Historical review, empirical findings, and critical reflections - som også var et kernedokument under kædesøgningen. Artiklen har 15 citationer i Scopus og 43 referencer. Kernedokument 2: The Chinese ambivalence to humor: Views from undergraduates in Hong Kong and China - ligeledes et kernedokument ved kædesøgningen. Denne artikel har 6 citationer i Scopus og 46 referencer. Med udgangspunkt i de to kernedokumenter vil jeg ved brug af citationssøgningen ancestry search nu finde relevante dokumentrepræsentationer indenfor emnet Humor i Kina. Fra kernedokumentet Exploration of Chinese humor: Historical review, empirical findings, and critical reflections finder jeg blandt referencerne følgende 15 relevante titler: A Study Of Ancient Chinese Jokes Coping humor of 354 Chinese university students Soft Humor of Chinese The Studies Of Traditional Jokes And Humor In The 20th Century China The laughing Buddha: Zen And The Comic Spirit Chinese Wit And Humor Jokes, Humor and Chinese people Taiwanese Perceptions Of Humor: A Sociolinguistic Perspective Humor versus huaji Introduction to Chinese Wit And Humor Stifled laughter: How the Communist Party killed Chinese humor Wu-wei: The non-doing philosophy in Chinese humor Traditional Chinese humor: Art and literature The Western and Chinese origin of Lin Yu-tang's outlook on humor The synthesis and researches on verbal humor in China 20

Fra det andet kernedokument The Chinese ambivalence to humor: Views from undergraduates in Hong Kong and China finder jeg blandt referencerne, følgende relevante titler: A comparison of humor styles, coping humor, and mental health between Chinese and Canadian university students The comparison of laugh behaviors between japan and china-based on the questionnaires of the university students in osaka and Shanghai One aspect of Taiwanese and American sense of humour: Attitudes toward pranks Sense of humor: Americans vs taiwanese Translating 'humor' into Chinese culture Creativity and humor: Chinese perspective Jeg foretager nu citationssøgning i form af forward citation search / cited reference search ved at undersøge kernedokumenternes citationer. Herved finder jeg titlerne: Humor styles, creative personality traits, and creative thinking in a hong kong sample Humor styles and loneliness: A study among Hong Kong and Hangzhou undergraduates Humour styles, gelotophobia and self-esteem among Chinese and Indian university students The relationship among humor styles and creative thinking among Chinese students in Hong Kong Different attitudes toward humor between Chinese and American students: Evidence from the Implicit Association Test Nomination of best humorists: A study of 679 undergraduates in Hangzhou, Hong Kong, and Vancouver Chinese teachers' use of humour in coping with stress A comparative study of students perceptions of humour in learning creative design between China and Denmark Students' Perceptions of Humor and Creativity in Project-Organized Groups (POGs) in Engineering Design Education in China About English-language scholarship on humor in ancient Chinese literature - som jeg nu kan tilføje på listen over relevant litteratur fundet ved citationssøgning. 21

5. Sammenligning & Diskussion 5.1 Bloksøgning, kædesøgning og citationssøgning Som ovenstående analyse viser, kan de tre søgestrategier anvendes som værktøjer i én samlende søgestrategi, hvormed der bliver skabt synergieffekt, hvilket resulterer i højere recall og højere precision. Brugeren skal dog være opmærksom på, at denne integration er tidskrævende. 5.1.1 Bloksøgning: Styrker & Svagheder Styrker En klar styrke ved bloksøgning er søgestrategiens fleksibilitet med hensyn til at justere på henholdsvis precision og recall. Dette sker ved at øge og mindske antallet af facetter, ved brug afgrænsning iform af den boolske operator NOT, og ved at tilføje og fjerne søgeord i hver facet. Tidsmæssigt er det hurtigt at foretage en bloksøgning, når søgeordene er identificeret. Bloksøgning tager ikke udgangspunkt i et eller flere kernedokumenter, som er tilfældet ved kædesøgning og citationssøgning. Brugerens baggrundsviden kan danne grundlag for relevante søgeord. Svagheder Det er nemt at begå fejl i forbindelse med skrive og have overblik over søgestrengen og de boolske operatorer. Bare én stavefejl eller slåfejl kan give resultater, som ikke er hensigtmæssige. Intentionen om at undgå false drops ved brug af den boolske operator NOT kan medføre udelukkelse af relevante dokumentrepræsentationer i søgeresultaterne. Derudover kan brugen af mange facetter udelukke relevante dokumentrepræsentationer. Det kan være en svaghed, at det er op til den enkelte bruger at komme på relevante søgeord. Dermed skal brugeren kende termer på forhånd og kunne inddele dem i facetter. Mangel på kendskab til fagterminologi vil give lav grad af recall. Derudover skal brugeren kunne oversætte et informationsbehov til relevante søgetermer. Sker dette ikke i tilstrækkelig grad, vil søgeresultaterne ikke være relevante. 22

5.1.2 Kædesøgning: Styrker & Svagheder Styrker Væsentlige styrker ved kædesøgning er høj precision og høj recall. Kædesøgning begynder med høj precision og øger gradvist recall (Harter, 1986, s. 183). Kædesøgning giver samtidig en god mulighed for indføring i et emne. Det sker ved, at brugeren, der udfører kædesøgningen, identificerer relevante fagspecifikke termer indenfor et givent emne, ved at undersøge eksempelvis abstracts for relevante søgeord og ved at identificere de enkelte dokumentrepræsentationers indekseringstermer som er tildelt af professionelle indeksører. På denne måde får brugeren, der udfører kædesøgningen, en indsigt i feltets terminologi. En styrke er det også, at kædesøgning kan tage udgangspunkt i få kernedokumenter. Det er således relativt nemt at komme i gang med kædesøgningen og brugeren kan gennem kædesøgningen identificere få relevante dokumenter indenfor et givent emneområde ved minimal indsats, og uden at processen er tidskrævende. Kædesøgning gør det også muligt at foretage en udtømmende søgning ( exhaustive search ) (Schlosser et al., 2006, s. 569; Chowdhury, 2010, s. 203) og brugeren kan dermed finde alle indekserede dokumentrepræsentationer om et givent emne i en database og på tværs af databaser (såfremt dokumentrepræsentationer indenfor det givne emne ikke er blevet tildelt atypiske indekseringstermer). Dette kræver dog, at brugeren har kendskab til feltets terminologi og kan identificere relevante søgeord, synonymer, nært-beslægtede termer og andre nuanceforskelle i terminologien. Svagheder Kædesøgning kan være ganske tidskrævende. Dette er tilfældet, hvis der ønskes mange relevante dokumentrepræsentationer af søgningen, og brugeren samtidig ikke har kendskab til feltet og dermed skal bruge tid på at sætte sig ind i feltets terminologi og de enkelte termers relationer og tilhørsforhold til hinanden for efterfølgende at kunne placere dem hensigtsmæssigt i facetter i en bloksøgning. En anden svaghed ved kædesøgning er i de tilfælde, hvor dokumentrepræsentationerne udelukkende er indekseret ved indekseringstermer. Her kan brugeren se sig nødsaget til at starte forfra ved 23

søgning i andre databaser, idet disse databaser kan anvende andre indekseringstermer. Kædesøgning er baseret på den antagelse, at lignende dokumenter er indekseret på samme måde. Dette kan blive en svaghed, hvis et kernedokument er tildelt atypiske indekseringstermer (Schlosser et al., 2006, s. 579), og kædesøgning foretages ved kun at tage udgangspunkt i dette ene kernedokument. En kædesøgning med kun få fundne søgeord i hver facet kan betyde, at den samlede søgning giver få vinkler på emnet, og dermed får brugeren ikke et dækkende billede af hvilke dokumentrepræsentationer, der findes indenfor emnet i den pågældende database. Indekseringssproget ændrer sig over tid, og såfremt dokumentrepræsentationerne i en database ikke bliver opdateret med nutidssvarende indekseringstermer, så kan en bruger risikere at søge på forældede indekseringstermer, hvormed brugeren ikke bliver bekendt med eksempelvis den seneste forskning på området. At søge på ældre indekseringstermer kan på den anden side medføre, at brugeren bliver bevidst om tidligere indekseringspraksis og kan deraf finde relevante dokumenter publiceret i samme tidsperiode (Schlosser et al., 2006, s. 580). Dermed kan brugeren udforske udviklingen af termer indenfor et givent område og i det/de kontrollerede vokabular(er) anvendt i den pågældende database. Det er en svaghed, at kædesøgning medfører false drops, hvilket skyldes, at søgningen medtager alle dokumentrepræsentationer, hvori søgeordene fremgår. False drops kan forekomme af forskellige årsager, eksempelvis: Det enkelte søgeord kan have flere betydninger, hvilket medfører false drops i søgeresultaterne. Forfatteren/forfatterne kan komme til at tilføje enkelte keywords/emneord/tags som kan være misvisende. Automatisk/maskinel indeksering, såsom KeyWords Plus i Web of Science Core Collection, kan også medføre false drops. 24

5.1.3 Citationssøgning: Styrker & Svagheder Styrker En styrke ved citationssøgning er, at brugeren ved at undersøge et dokuments referencer og citationer vil finde lignende relaterede dokumenter ( searches by similarity ) (De Bellis, 2009, s. 42). Citationssøgning er tværvidenskabelig og tager ikke højde for fagdiscipliner ( multidisciplinary and interdisciplinary searches ) (De Bellis, 2009, s. 42). Dette er en fordel, når et forskningsområde er spredt over flere emner/fag/discipliner. Der søges med andre ord ikke på emne. Derimod tages der udgangspunkt i litteratur fra forskere, som allerede er involveret i de pågældende forskningsområder. Ved citationssøgning er det muligt at finde en beskrivelse af specifikke metodiske teknikker ( methodology searches ) (De Bellis, 2009, s. 42) og efterfølgende undersøge, hvorledes de er anvendt af forskellige forskere. Forfatteren til eksempelvis en tidsskriftartikel henviser til det dokument, hvorfra en særlig anvendt teknik oprinder. En bruger kan dermed på egen hånd læse mere om denne teknik ved at læse det oprindelige dokument, der henvises til. Alle andre forskere der har anvendt samme teknik vil desuden have henvist til samme dokument. Så ved at undersøge dette oprindelige dokuments citationer, er det også muligt at se, hvorledes samme teknik er anvendt af forskellige forskere. Endnu en styrke ved citationssøgning er, at den kan anvendes til at følge udviklingen af en teknik, et koncept og/eller en teori ( follow-up and state-of-the-art searches ) (De Bellis, 2009, s. 42). Dermed kan en bruger finde opdateringer af eksempelvis specifikke metodiske teknikker, ved at undersøge det oprindelige dokument for citationer, idet forskere citerer de teknikker, som de bygger videre på. Svagheder Ved citationssøgning findes lignende relaterede dokumenter, og brugeren får dermed ikke belyst forskningsområdets nuancer, men får kun kendskab til en eller få vinkler på området. False drops kan forekomme på baggrund af personlige og/eller karrieremæssige årsager. Buntrock fremhæver, at han i sin 44-årige karriere som kemisk informationsspecialist stødte på adskillige false drops ved citationssøgning. Ved anvendelse af false drops kan forskeren ad omveje eksempelvis komme til at fremstå, som ham/hende der opdagede en ny sammensætning af kemiske elementer (Buntrock, 2016, s. 561). 25

5.2 Web of Science og Scopus Web of Science Scopus Type Bibliografisk database, citationsindeks Bibliografisk database, citationsindeks Drift Kommerciel Kommerciel Medie Internet Internet Sprog Engelsk Engelsk Tidsskrifter, forskningsom råder Science, Social Science Arts & Humanities Science, Social science Arts & Humanities, Technology, Medicine Antal peer-review ed tidsskrifter 17.500 21.500 Antal dokum entrepræsentationer 55 millioner 60 millioner Kontrolleret vokabular Nej Ja, for 80% af dokumentrepræsentationerne De udvalgte kernedokumenter har henholdsvis 13, 10 og 7 citationer i Web of Science. I Scopus har samme kernedokumenter henholdsvis 15, 12 og 6 citationer. Dette skyldes, at citationer kun medtages fra indekserede dokumentrepræsentationer i den pågældende database. Ved anvendelse af de 3 søgestrategier bloksøgning, kædesøgning og citationssøgning har jeg udledt og brugt en enslydende søgestreng i Web of Science Core Collection og Scopus, hvormed jeg har identificeret 273 dokumentrepræsentationer af tidsskriftartikler i Web of Science Core Collection og 370 dokumentrepræsentationer af tidsskriftartikler i Scopus om emnet Humor i Kina. Scopus indeholder generelt flere dokumentrepræsentationer end Web of Science Core Collection, og det viser sig også at gælde indenfor emnet Humor i Kina - hvor Scopus indeholder 97 flere dokumentrepræsentationer af tidsskriftartikler om emnet sammenlignet med Web of Science Core Collection. Jeg har manuelt gennemgået og sammenholdt dokumentrepræsentationerne. Resultatet af denne undersøgelse er, som følger: 88 af de 273 dokumentrepræsentationer fra Web of Science er ikke at finde i Scopus. Det vil sige at de resterende 185 dokumentrepræsentationer fra Web of Science er at finde i Scopus. Når Web of Science og Scopus har 185 dokumentrepræsentationer tilfælles i undersøgelsen, betyder det, at Scopus indeholder 370-185 = 185 dokumentrepræsentationer som ikke er at finde i Web of Science. Samlet set er fundet 88 (Web of Science) +185 (fælles) + 185 (Scopus) dokumentrepræsentationer af tidsskriftartikler i de to bibliografiske databaser om emnet Humor i Kina. Dette peger i retning af, at det er en god idé at anvende begge databaser i forbindelse med informationssøgning efter videnskabelig litteratur. 26

6. Konklusion Jeg har i denne opgave belyst kendetegnene ved de bibliografiske databaser Web of Science og Scopus samt søgestrategierne bloksøgning, kædesøgning og citationssøgning. Jeg har demonstreret, hvorledes søgestrategierne kan anvendes til at identificere relevante dokumenter indenfor emnet Humor i Kina ved brug af ovennævnte databaser. Dernæst har jeg diskuteret styrker og svagheder ved de 3 søgestrategier i forhold til hinanden. Sidst, men ikke mindst har jeg sammenlignet Web of Science og Scopus. Web of Science er kendetegnet ved at være en online kommerciel bibliografisk database og citationsindeks på engelsk indeholdende 55 millioner dokumentrepræsentationer af bøger, konferencepapirer samt tidsskriftartikler fra 17.500 peer-reviewed tidsskrifter indenfor forskningsområderne science, social science og art & humanities. Der er ingen anvendelse af kontrolleret vokabular i Web of Science. Scopus er kendetegnet ved at være en online kommerciel bibliografisk database og citationsindeks på engelsk indeholdende 60 millioner dokumentrepræsentationer af bøger, konferencepapirer samt tidsskriftartikler fra 21.500 peer-reviewed tidsskrifter indenfor forskningsområderne science, social science, art & humanities, technology og medicine. 80% af dokumentrepræsentationerne i Scopus er indekseret med indekseringstermer fra et eller flere kontrollerede vokabularer. Formålet med søgestrategierne bloksøgning, kædesøgning og citationssøgning er at finde relevant information, der kan opfylde et informationsbehov. Det er kendetegnende for bloksøgning, at brugeren opstiller en søgestreng, der tager udgangspunkt i facetter med relevante søgeord og indekseringstermer, hvor søgeresultaterne herfra består af dokumentrepræsentationer med minimum et søgeord/indekseringsterm fra hver facet. For kædesøgning er det kendetegnende, at brugeren tager udgangspunkt i et eller flere kernedokumenter, som brugeren har fundet relevante indenfor et givent emne. Brugeren undersøger med hvilke relevante indekseringstermer disse kernedokumenter er indekseret i den pågældende database. Lignende relevante dokumenter vil alt andet lige være indekseret på samme måde. Andre 27

søgbare metadata i kernedokumenterne undersøges ligeledes for relevante søgeord. Identificerede søgeord og indekseringstermer indgår herefter i facetter i en bloksøgning efter flere relevante dokumenter. Citationssøgning tager også udgangspunkt i kernedokumenter. Her undersøges kernedokumentets referencer og citationer med henblik på at finde lignende relevant materiale. De tre søgestrategier kan anvendes som værktøjer i én samlende søgestrategi. Dette leder til søgestrengen: (china or chinese or hong kong or cantonese or shanghai or beijing or taiwan or mandarin) AND (humor* or joke* or joking or funny or comic or comedy or huaji or youmo or satire or parody or laugh*) NOT aqueous NOT humoral - som kan anvendes til søgning efter dokumentrepræsentationer om emnet Humor i Kina i Web of Science og Scopus (den boolske operator NOT, skrives AND NOT i Scopus). Der er flere styrker og svagheder ved de tre søgestrategier. Overordnet set hjælper søgestrategierne med at opfylde et informationsbehov, og ved at kombinere dem har brugeren mulighed for at højne graden af recall og precision. Den store svaghed er, at det kan være tidskrævende at finde søgeresultater med høj grad af recall og precision. Scopus indeholder flest dokumentrepræsentationer af tidsskriftartikler om emnet Humor i Kina. Ialt er fundet 88 (Web of Science) +185 (fælles) + 185 (Scopus) dokumentrepræsentationer af tidsskriftartikler i de to bibliografiske databaser om emnet Humor i Kina. Dette indikerer, at det er en god idé, at anvende begge databaser i forbindelse med informationssøgning efter videnskabelig litteratur. 28

7. Litteraturliste APA-modellen er anvendt i opgaven. Accili et al. (2002). From Funny Current to HCN Channels: 20 Years of Excitation. Physiology. 17(1), s. 32-37 lokaliseret den 7. juni 2016 på http://physiologyonline.physiology.org/content/17/1/32 Buntrock, R. E. (2016). Using Citation Indexes, Citation Searching, and Bibliometrics To Improve Chemistry Scholarship, Research, and Administration. Journal of Chemical Education, 93(3), s. 560-566. Chowdhury, C.G. (2010). Introduction to Modern Information Retrieval (3. udgave). Facet Publishing. CIA. (2015). The World Factbook. Lokaliseret den 7. juni 2016 på https://www.cia.gov/library/publications/the-world-factbook/geos/ch.html De Bellis, N. (2009). Bibliometrics and Citation Analysis: From the Science Citation Index to Cybermetrics. Kap. 1+2. Scarecrow press. Den Danske Ordbog. (u. å.). søgestreng. Lokaliseret den 7. juni 2016 på http://ordnet.dk/ddo/ordbog?query=søgestreng Den Store Danske. (2011). truncus. Lokaliseret den 7. juni 2016 på http://denstoredanske.dk/krop,_psyke_og_sundhed/sundhedsvidenskab/cellebiologi_og_almen_his tologi/truncus Elsevier. (2016). Scopus Content Coverage Guide PDF. Lokaliseret den 7. juni 2016 på https://www.elsevier.com/ data/assets/pdf_file/0007/69451/scopus_content_coverage_guide.pdf Google Translate. (2016a). huaji. Lokaliseret den 7. juni 2016 på https://translate.google.com/#zh-cn/da/huaji 29

Google Translate. (2016b). humor. Lokaliseret den 7. juni 2016 på https://translate.google.com/#da/zh-cn/humor Harter, S.P. (1986). Online Information Retrieval: Concepts, Principles, and Techniques. Kap. 7. Academic Press. Informationsordbogen. (2012). oversigtsartikel. Lokaliseret den 7. juni 2016 på http://www.informationsordbogen.dk/concept.php?cid=2732 Linder, S. K. et al. (2015). Citation searches are more sensitive than keyword searches to identify studies using specific measurement instruments. Journal of clinical epidemiology, 68(4), s. 412-7. Morville, P. & Rosenfeld, L. (2007). Information architecture for the World Wide Web. (3. udg.). Sebastopol, CA: O Reilly. RELX Group. (2016). Publication of Annual Reports and Financial Statements 2015 and Notices of 2016 Annual General Meetings. Lokaliseret den 7. juni 2016 på http://www.relx.com/mediacentre/pressreleases/2016/pages/annual-report-2015.aspx Russell-Rose T. & Tate T. (2013). Designing the Search Experience. Elsevier. Schlosser, R.W. et al. (2006). Use of information-seeking strategies for developing systematic reviews and engaging in evidence-based practice: The application of traditional and comprehensive pearl growing: A review. International Journal of Language & Communication Disorders, 41(5), s. 567-582. Scopus. (2016a). Effectiveness of humor intervention for patients with schizophrenia: A randomized controlled trial. Lokaliseret den 7. juni 2016 på https://www-scopuscom.ep.fjernadgang.kb.dk/record/display.uri?eid=2-s2.0-84908381736&origin=resultslist&sort=plff&src=s&st1=humor+and+china&st2=&sid=7961fda38b786310298d78a7b00e378f.f594dypd Cy4K3aQHRor6A%3a280&sot=b&sdt=b&sl=30&s=TITLE-ABS-KEY%28humor+and+china %29&relpos=17&citeCnt=2&searchTerm= 30

Scopus. (2016b). Constructing a shared 'Hong Kong identity' in comic discourses. Lokaliseret den 7. juni 2016 på https://www-scopus-com.ep.fjernadgang.kb.dk/record/display.uri?eid=2-s2.0-8744239412&origin=resultslist&sort=plf-f&src=s&st1=%22constructing+a+shared+ %27Hong+Kong+identity%27+in+comic+discourses %22&st2=&sid=7961FDA38B786310298D78A7B00E378F.f594dyPDCy4K3aQHRor6A %3a450&sot=b&sdt=b&sl=79&s=TITLE-ABS-KEY%28%22Constructing+a+shared+ %27Hong+Kong+identity%27+in+comic+discourses %22%29&relpos=0&citeCnt=15&searchTerm= Sense About Science. (2011). I don't know what to believe.... Lokaliseret den 7. juni 2016 på http://www.senseaboutscience.org/data/files/resources/16/idontknowwhattobelieve_web2011.pdf Syddansk Universitetsbibliotek. (2008). Trunkering. Lokaliseret den 7. juni 2016 på http://www.binkoold.sdu.dk/psykologi/modul_1/informationskompetence%20modul%201_05.htm Thomson Reuters. (2016a). About us. Lokaliseret den 7. juni 2016 på http://thomsonreuters.com/en/about-us.html Thomson Reuters. (2016b). Journal Search Science Citation Index Expanded Journal List (8845 journaler) Journal Search Social Sciences Citation Index Journal List (3244 journaler) Journal Search Art & Humanities Citation Index Journal List (1778 journaler) Journal Search Emerging Sources Citation Index Journal List (3621 journaler) Lokaliseret den 7. juni 2016 på http://ip-science.thomsonreuters.com/cgi-bin/jrnlst/jlresults.cgi?pc=d http://ip-science.thomsonreuters.com/cgi-bin/jrnlst/jlresults.cgi?pc=ss http://ip-science.thomsonreuters.com/cgi-bin/jrnlst/jlresults.cgi?pc=h http://ip-science.thomsonreuters.com/cgi-bin/jrnlst/jlresults.cgi?pc=ex Thomson Reuters. (2014). Web of Science Core Collection - Quick Reference Guide. Lokaliseret den 7. juni 2016 på http://wokinfo.com/media/pdf/wos_core_collection_qrc.pdf Web of Science. (2016a). The Chinese ambivalence to humor: Views from undergraduates in Hong Kong and China. Lokaliseret den 7. juni 2016 på 31

http://apps.webofknowledge.com.ep.fjernadgang.kb.dk/full_record.do? product=wos&search_mode=generalsearch&qid=5&sid=v2eddoppxvm4ibcvilf&page=3&do c=23 Udenrigsministeriet. (2010). Tapei (Taiwan) - Handelskontor. Lokaliseret den 7. juni 2016 på http://kina.um.dk/da/om-os/danske-repraesentationer-i-kina/taipei-taiwan---handelskontor/ Web of Science. (2016a). Web of Science. (2016b).Web of Science Core Collection Help. Lokaliseret den 7. juni 2016 på http://images.webofknowledge.com.ep.fjernadgang.kb.dk/wokrs522r4/help/wos/hp_full_recor d.html Web of Science. (2016c). Web of Science Core Collection Results. Lokaliseret den 7. juni 2016 på http://apps.webofknowledge.com.ep.fjernadgang.kb.dk/summary.do? product=wos&colname=wos&qid=5&sid=v2eddoppxvm4ibcvilf&search_mode=generalse arch&formvalue%28summary_mode %29=GeneralSearch&update_back2search_link_param=yes&page=1 32

8. Bilag Bilag 1 33