Taksonomikonstruktion

Taksonomikonstruktion - Strukturering af IDAs vidensunivers Det erhvervsrelaterede projekt Danmarks Biblioteksskole 2009 Skrevet af: Hans Christian Kjær Hvillum & Leon Hetlevik Vejleder: Karen Birgitte Philipson Antal ord: 9.823 Afleveringsdato: 5. januar 2009

Ud for de afsnit som Leon Hetlevik har skrevet, står der (LH). Ud for de afsnit som Hans Christian Kjær Hvillum har skrevet, står der (HCKH). ABSTRACT (HCKH OG LH)... 3 INDLEDNING (HCKH OG LH)... 4 PROBLEMFORMULERING (HCKH OG LH)... 5 BEGREBSAFKLARING (HCKH OG LH)... 6 METODE (LH)... 7 FORANALYSE... 7 KONSTRUKTION... 7 PROCESAFSNIT... 9 PLANLÆGNINGSFASEN (LH)... 9 Enumerative og facetterede systemer... 9 Kontrollerede vokabularer... 10 TERMINDSAMLING (HCKH)... 12 Indsamling af termer fra IDA... 13 Interviews... 13 Ordoptælling... 15 DESIGN OG UDFORMNING AF TAKSONOMIEN (LH)... 16 Taksonomiens opbygning... 16 De ni nøglekriterier... 19 IMPLEMENTERINGSFASEN (HCKH)... 22 1. REPRÆSENTATIONEN AF TAKSONOMIEN SKAL PLANLÆGGES:... 22 2. TAKSONOMIEN SKAL INTEGRERES I DEN EKSISTERENDE INFRASTRUKTUR:... 22 3. STYRINGSPROCESSEN SKAL SIKRES:... 22 Vedligeholdelse af taksonomien... 22 Tildeling af emneord... 23 Card sorting... 25 KONKLUSION (HCKH OG LH)... 26 PERSPEKTIVERING (HCKH OG LH)... 27 LITTERATURLISTE... 28 FASTFORMSDOKUMENTER... 28 ELEKTRONISKE DOKUMENTER... 29 BILAG 1 TAKSONOMIEN... 30 BILAG 2 INTERVIEW... 35 BILAG 3 FOREDRAG... 36 2

Abstract (HCKH og LH) I denne opgave beskrives processen med at konstruere en taksonomi til ingeniørforeningen i Danmark (IDA). Formålet med taksonomien er, at strukturere de dokumenter, der ligger på IDAs fællesdrev. Hoveddelen af opgaven består af et procesafsnit, der i tre afsnit forklarer arbejdet. Første afsnit omhandler planlægningsfasen. Der redegøres for overvejelser og valg af kontrolleret vokabular og taksonomi, og enumerative og facetterede systemer diskuteres. I andet afsnit beskrives de metoder, der er valgt til termindsamling. Det drejer sig om indsamling af termer fra IDAs allerede eksisterende vokabularer, interviews og ordoptælling. Arbejdet med metoderne beskrives, og deres anvendelighed vurderes. Tredje afsnit beskriver de metoder, der er anvendt til design og udformning af taksonomien. Heri beskrives taksonomiens opbygning, der tager udgangspunkt i PMEST, og de nøglekriterier der er anvendt, for at sikre en robust struktur. I opgavens anden del redegøres der for, hvad man skal være opmærksom på under implementeringsfasen og brug af taksonomien. Herunder tildeling af emneord, vedligeholdelse af taksonomien og brugertest i form af card sorting. Til sidst konkluderes det, hvilke metoder, der viste sig brugbare, og at det er vigtigt, at IDA etablerer en række foranstaltninger der sikrer, at taksonomien forbliver levende og relevant. 3

Indledning (HCKH og LH) Logisk håndtering af dokumenter og informationsrelationer i projekter og sager, er en voksende udfordring for de fleste viden- og servicebaserede virksomheder, store som små, hvor mange informationer, og meget viden dagligt skal håndteres. Der er et voksende behov for håndtering af den stadig stigende og ustrukturerede informationsmængde, og et behov for struktureret samarbejde på tværs af en organisation, og med eksterne brugere, kunder eller partnere. Samt at vital information ikke går tabt på lokale drev eller i mails, men er let tilgængelig i korrekt sammenhæng og version, overfor de rette personer. Alle data og informationer er i dag indeholdt i en ofte komplekst sammenkoblet it-infrastruktur. Det er disse data og informationer, der tilsammen udgør centrale byggesten i medarbejdernes viden. Men de gør ingen nytte, hvis medarbejderne ikke kan finde dem. Her er dokumenthåndtering en stor hjælp. Dokumenthåndtering dækker overordnet over procedurer og systemer, der sikrer, at dokumenter kan genfindes, så information ikke skal rekonstrueres og viden genopbygges. Det er nemlig både dyrt og spild af tid. Dokumenthåndtering er således et afgørende videndelingsværktøj, og den gode dokumenthåndtering åbner for kvalitetsmæssige forbedringer og effektiviserede arbejdsgange, når tiden ikke skal bruges til at genfinde dokumenter i virksomhedens it-arkitektur. Det giver overblik og dermed klare fordele for organisationen, såvel som for den enkelte medarbejder. Ingeniørforeningen i Danmark (IDA) er landets største interesseorganisation og fagforening for tekniske og naturvidenskabelige akademikere. De har ca. 200 ansatte fordelt mellem hovedkontoret i København, og regionskontorer i Aalborg, Århus og Odense. Foruden at være en fagforening for ingeniører, har IDA også en konferencevirksomhed, og de beskæftiger sig med påvirkning af samfundet gennem lobbyvirksomhed. IDA har som en del af deres Vision IDA 2011, et ønske om at blive den førende akademiske faglige interesseorganisation 1. Med deres egne ord: "Ingeniørforeningen vil kæmpe for de bedst tænkelige vilkår i kompetenceudvikling, arbejdsliv og familieliv for sine medlemmer i en balancering af de individuelle, stands- og samfundsmæssige hensyn. 2 For at opnå denne vision, mener de, at det er vigtigt, at gøre IDAs vidensressourcer tilgængelige på en nem og overskuelig måde. I den forbindelse udbød IDA seks mulige opgaver for biblioteksskolens erhvervsrelaterede projekt på 7. semester. Det drejer sig om: Udarbejdelse af en taksonomi Forslag til etablering af søgemaskine 1 Ingeniørforeningen, IDA. (2008). 2 Ibid. 4

Kortlægning af informationskilder Vidensportal på intranettet Automatisk indeksering og tildeling af metadata Formålet med nærværende opgave er, at konstruere et udkast til et kontrolleret vokabular i form af en taksonomi til IDA, fordi vi ser det som værende udgangspunktet for de andre opgaver. Denne taksonomi skal bruges til at strukturere deres dokumenter, således at deres vidensunivers bliver mere overskueligt. Det er meningen, at taksonomien skal kunne benyttes af alle organisationens ansatte i deres daglige arbejde. Derfor er der et krav til, at den udover at være bredt dækkende, også skal kunne anvendes af folk, der ikke er informations- eller domænespecialister. Ordet taksonomi stammer fra de to græske ord: Taxis og nomos. Taxis betyder klassifikation eller orden, mens nomos betyder styring eller lov. 3 Så en taksonomi er en inddeling af fænomener (objekter eller begreber) i en hierarkisk klassifikation eller principperne bag klassifikationen af samme. 4 Vi har i opgaven lagt vægten på selve konstruktionen af taksonomien, og ikke på de efterfølgende tests og vedligeholdelse. Vi vil dog i opgaven beskrive metoder til disse formål. Disse overvejelser munder ud i følgende problemformulering: Problemformulering (HCKH og LH) Hvordan konstruerer man bedst muligt en taksonomi, der kan bruges til at strukturere IDAs vidensunivers? herunder Hvilke metoder egner sig bedst til formålet? Hvordan sikrer man sig at taksonomien forbliver relevant og levende? 3 Bitconomy. (2005, 13. december). 4 Wikipedia, den frie encyklopædi. (2008, 10. december). 5

Begrebsafklaring (HCKH og LH) Emneord/ termer: Vi bruger begrebet term for de ord eller begreber taksonomien består af, når de omtales i forbindelse med taksonomien. Når disse samme termer omtales i forbindelse med indeksering, kalder vi dem emneord. Over-/ underordnet term: Med disse begrebene mener vi termer der har en relation til hinanden. Den overordnede term står et niveau højere i taksonomiens hierarki end den underordnet term, som således står i underordnet relation til den overordnede. På engelsk bruges parent og child om denne relationen. Kategori: Dette begreb bruger vi som en samlebetegnelse for alle de termer der står i niveauet under en term i taksonomien. Eksempelvis er kategorien Uddannelse alle de uddannelser, der er listet op i det underordnede niveau. 6

Metode (LH) Foranalyse Udgangspunktet for vores projekt var en løst formuleret tekst fra IDAs IT-afdeling, hvor de efterlyste hjælp til at klassificere og kortlægge IDAs vidensressourcer, samt skabe sammenhæng mellem alle data i deres forretningssystemer. Opgaven var stor og uoverskuelig, og indledningsvis druknede vi nærmest i IDAs planer, visioner og drømme om en fremtid, hvor man nærmest ikke skulle lede efter noget, det skulle bare dukke op, når man havde brug for det. Da vi ikke havde noget forkundskab om IDA, var det derfor vigtigt for os, at forstå organisationens opbygning og hvad de laver, for at finde ud af, hvordan vi bedst kunne hjælpe. Denne forståelse fik vi, ved at konstruere et concept map over organisationen. Et Concept map er et diagram, der viser sammenhængene mellem koncepter 5. Det er et grafisk værktøj til at organisere og repræsentere viden. Idéen er, at disse koncepter er omgivet af cirkler eller bokse, og relationerne mellem dem vises med streger eller pile, der forbinder dem. Disse pile kan man navngive. F.eks. Bliver varetaget af, Består af. Til at konstruere vores Concept map brugte vi programmet CMAP, et freeware-program der er beregnet til netop at konstruere Concept maps. Det, der virkelig var givtigt, var processen med at skabe et concept map. Den gav os en forståelse af organisationen IDA, samt en masse gode termer. Med den nyerhvervede viden om IDAs opbygning, gik vi i gang med at interviewe personer fra de forskellige afdelinger. Spørgsmålene drejede sig om, hvad de laver i afdelingen, hvilke informationer de producerer, og hvilke af de andre afdelinger de samarbejder med. Undervejs i interview-processen fik vi styrket vores forståelse af IDA, og de kommunikationsveje de ansatte bruger. Konstruktion Gennem dette indledende arbejde bestemte vi os for at organisere P-drevet, hvor de ansatte gemmer de fleste af deres dokumenter. Der findes ingen faste retningslinjer for, hvordan dokumenterne på P- drevet skal organiseres, så hver enkelt medarbejder laver selv sin egen struktur. Denne struktur er ikke nødvendigvis dårlig, men der opstår problemer, når andre skal finde dokumenter de ikke selv har produceret. Efter at have gemt dokumenter på p-drevet uden retningslinjer i flere år, må man sige, at dette system har måttet vige pladsen for kaos. For at skabe et system i dette kaos, satte vi os for, at konstruere et kontrolleret vokabular, som skal bruges til at tildele dokumenterne emneord. Sammen med et dokumenthåndteringsprogram vil emneordene skabe en struktur i deres dokumenter, og deres vidensunivers bliver mere overskueligt. Det er meningen, at taksonomien skal kunne benyttes af alle organisationens ansatte i deres daglige 5 White, H. (2007, 12 marts). 7

arbejde. Derfor er der også et krav til, at den udover at være bredt dækkende, også skal kunne anvendes af folk, der ikke er informations- eller domænespecialister. Termindsamlingen består af både top-down- og bottom-up-metoden 6. Top-down-metoden har vi brugt når vi har fundet termer fra allerede eksisterende vokabularer fra IDA. Det er f.eks. listen over kategorier for nyheder og arrangementer på ida.dk, og termer der blev brugt i det tidligere journalsystem Axapta. 7 Det anbefales også, at man kigger på eksisterende vokabularer når man skal konstruere et kontrolleret vokabular 8. Bottom-up-metoden har vi brugt, når vi har kigget på dokumenter fra IDA, og udtrukket termer fra dem. Dokumenterne er hentet fra ida.dk, deres intranet og i mindre grad P-drevet. Disse to metoder komplimenterer hinanden godt 9. De har på hver deres måde givet gode termer til taksonomien. Vi havde i udgangspunktet tænkt at indsamle termer til taksonomien hovedsageligt ved hjælp af et ordoptællingsprogram som textalyser.net. Ved hjælp af zipf s lov 10 ville vi finde frem til de gode termerne fra eksemplariske dokumenter taget fra P-drevet. Med eksemplariske dokumenter menes de dokumenter, der er mere repræsentative for samlingens intellektuelle struktur end andre 11. Det viste sig dog, at disse ikke var mulige at skille fra hinanden i praksis, da P-drevet var for uoverskueligt et system. Vi havde ingen chance for at finde frem til de eksemplariske dokumenter, og frygtede derfor, at vi ville ende op med termer der ikke var repræsentative for IDA, eller i det mindste ikke ville dække bredt nok. I vores begrebsindsamling ledte vi efter opbygning og inddeling i kategorier og klasser. Det var ud fra disse informationer, vi konstruerede det Concept Map, der hjalp os med at få styr på organisationens opbygning. Vi interviewede også otte personer fra forskellige afdelinger, der kommer til at benytte taksonomien. 12 Med interviewene ønskede vi at afdække respondenternes arbejdsopgaver og informationsbehov. Til udarbejdelsen af det kontrollerede vokabular, tog vi udgangspunkt i eksisterende teorier omkring indeksering, og opbygning af systemer til indeksering af viden. Primært bøgerne: Organising Knowledge: Taxonomies, Knowledge and Organisational Effectiveness og Building Enterprise Taxonomies. Valget faldt primært på disse to bøger, fordi de havde fået gode anmeldelser på diverse fora. Desuden var det svært, at finde anden litteratur, da virksomhedstaksonomier er et forholdsvist nyt emne. 6 Wikipedia, den frie encyklopædi. (2008, 26. december).down 7 Microsoft Dynamics Axapta er en integreret virksomheds og e-businessløsning. Axaptas hjemmeside: http://www.microsoft.com/danmark/dynamics/axapta/default.mspx 8 Lykke Nielsen, M. (2001), s. 9. 9 Lykke Nielsen, M. (2001), s. 9. 10 Kowalski, G. J., & Maybury, M. T. (2000), s. 14. 11 Blair, D. C., & Kimbrough, S. O. (2001), s. 366. 12 Det drejer sig om: IT-afdelingen, Fællessekretariatet, Kommunikationsafdelingen, HR-afdelingen, Rådgivning og Forhandling, Politisk interessevaretagelse. 8

Procesafsnit I dette afsnit beskriver vi, hvilke overvejelser vi har gjort under udarbejdelsen af taksonomien, de valg vi har truffet, og hvilke teorier vi har anvendt. Afsnittet er tredelt. Første del omhandler planlægningsfasen, dvs. de tanker, der lå forud for selve konstruktionen af taksonomien, og de valg der skulle træffes i forbindelse med dem. Anden del omhandler de metoder vi har anvendt i forbindelse med termindsamlingen, og en vurdering af, hvor godt de fungerede. Tredje del omhandler design og udformning af taksonomien, taksonomiens opbygning, og de kriterier vi har anvendt til at konstruere taksonomien. Planlægningsfasen (LH) En taksonomi er et klassifikationssystem med en hierarkisk struktur. I dette afsnit vil vi forklare de fordele, der er ved netop sådan et system. Enumerative og facetterede systemer Klassifikationssystemer kan opdeles i henholdsvis enumerative og facetterede systemer. Der er fordele og ulemper lige meget hvilket klassifikationssystem man vælger. I dette afsnit vil vi kort beskrive forskellene på de to systemer, og hvorfor vi har valgt det ene frem for det andet. Et enumerativt system 13, er et system, hvor alle tænkelige emner, både enkle og sammensatte, er udtrykt i klasser på forhånd. Det kan være et specielt system, der dækker et nærmere defineret område, som f.eks. økonomi, eller det kan være et universelt system, der forsøger at udtrykke klasser for alle emner overhovedet. Et eksempel på sidstnævnte er folkebibliotekernes DK5. Enumerative systemer har en kort og gennemskuelig notation, de er intuitivt lette at anvende, og strukturen er sædvanligvis let at gennemskue. Skal man konstruere et enumerativt system fra bunden, er dette imidlertid en noget omfattende og besværlig proces. Det er dog kun for konstruktøren, men det betyder, at det er økonomisk omkostningstungt. Det er svært at få alle nuancerne i emnerne med, samtidig med, at det kan være vanskeligt, at placere et emne i én og kun én klasse. Nye emner kan ikke tilføjes, hvilket betyder, at det ikke kan udbygges i takt med domænets eventuelle udvikling af nye begreber. Derfor vil jævnlige revisioner være nødvendige, og det kan være dyrt, hvis domænet er præget af hurtig udvikling af nye emner og begreber. Det er vores vurdering, at et enumerativt system vil kræve for omfattende opdateringer i et dynamisk miljø som IDAs, hvor nye begreber opstår regelmæssigt. Det vil ikke være fleksibelt nok. Vi har derfor valgt, at konstruere et facetteret klassifikationssystem 14. Facetterede systemer er systemer, hvor strukturen er fleksibel. Med andre ord, er kun de enkle klasser udtrykt i systemet og de sammensatte klasser udtrykkes således i notationen. Disse opbygges ved at analysere det emneområde, der skal dækkes i det antal begrebskategorier (facetter), der er tilstrækkeligt til at beskrive emnerne. Sammensatte emner har således ikke en indbygget klasse, men udtrykkes ved at kombinere de pågældende facetters notationselementer. De facetterede systemer kan være mere eller mindre frie eller stramme afhængig af valget af regler og principper for konstruktionen. Et eksempel herpå er den Universelle DecimalKlassifikation (UDK), der bruges af mange forsknings- og firmabiblioteker, som har behov for en elastisk struktur, der passer til lige netop 13 Stewart, D. L. (2008), s. 59. 14 Ibid, s. 61. 9

deres specifikke fagområde. UDK rummer dog enkelte elementer fra det enumerative system, hvilket gør, at det kun kan betegnes som et næsten facetteret system. Da vi i vores taksonomi har forsøgt, at dække alle aspekter af IDA, indeholder den også elementer fra det enumerative system. Facetterede systemer er forholdsvis lette at konstruere, og det er problemfrit, at oprette nye emner, idet notationen blot udbygges. Ligeledes er fleksibiliteten stor mht. nuancerede eller komplekse emner. Den største begrænsning eller ulempe (udfordring) ved det facetterede klassifikationssystem, er den udbyggede notation. Ligeså specifikt man kan udtrykke et emne, ligeså uoverskueligt kan det blive, særligt for dem, der ikke beskæftiger sig med informationssøgning på daglig basis. Dette forbehold gælder dog sædvanligvis kun for universelle facetterede klassifikationssystemer, der skal rumme mange områder og komplekse emner. Vi har forsøgt at tage højde for dette, ved at konstruere taksonomien ud fra ni kriterier, som bliver beskrevet senere i dette afsnit. Kontrollerede vokabularer I dette afsnit vil vi forklare, hvad kontrollerede vokabularer er, og nævne nogle eksempler på disse. Ved hjælp af dette vil vi komme frem til, hvorfor vi har valgt, at konstruere netop en taksonomi, og ikke en anden form for kontrolleret vokabular. Et kontrolleret vokabular består af nogle på forhånd udarbejdede, standardiserede termer, der kan bruges til at beskrive et emneområde eller informationsdomæne 15. De sikrer en vis grad af ensartethed og konsistens, hvilket er praktisk og hensigtsmæssigt, når der ikke er tilknyttet faste indeksører. Søgning bliver overskuelig, idet de på forhånd givne, standardiserede termer kan søges efter disse kan scannes eller søges på listen i fysisk form. En af fordelene ved et kontrolleret vokabular er, at man derved samler dokumenterne under bestemte, på forhånd autoriserede termer. Hermed muliggør man en høj grad af præcision. Ved brug af ukontrollerede emneord (termer??) risikerer man, at få mange forskellige emnedefinitioner af dokumenter, som sagtens kunne være samlet under ét. Dermed risikerer man, at skulle søge i flere forskellige kategorier, for at få et udtømmende søgesæt. Desuden vil man aldrig kunne være sikker på, at få et udtømmende søgeresultat, da ingen har overblik over, hvilke emneord der egentlig er tildelt. Bruges der udelukkende kontrolleret sprog, kan der naturligvis ikke søges på, eller tildeles ord udenfor hierarkiet 16. Dette kan resultere i, at fleksibiliteten bliver mindre og søgningen stiv. Der forekommer evt. tab af specificitet, f.eks. hvis et særligt begreb fra dokumentet skal udtrykkes med et mere generelt begreb. Dette mener vi dog at tage hensyn til, ved at man kan kontakte administratoren, hvis der mangler et emneord (læs afsnittet om brug af taksonomien). Der findes flere forskellige former for kontrollerede vokabularer, og de har varierende grad af kontrol og kompleksitet 17. Den simpleste type er en synonym-ring, der er en måde at associere alle 15 Stewart, D. L. (2008), s. 51. 16 Lancaster, F. W. (1998), s. 14. 17 Stewart, D. L. (2008), s. 51. 10

kendte variasioner af en term. Det være sig synonymer, akronymer eller kendte fejlstavelser. På den måde vil man, når man søger på en term, også søge på alle de termer, der er forbundet med søgetermen. Synonym-ringen hjælper således med at finde dokumenter, der omhandler ting der søges på, og kan give en god recall, men der er ikke en særlig høj grad af precision i søgningen. 18 En måde at forbedre synonym-ringen på, er ved at identificere en foretrukken term (authority file) blandt de associerede termer. Hvis man så søger på en ikke-foretrukken term, vil man blive ledt hen til den foretrukne. Både synonym-ringe og foretrukne termer kan forbedre søgningen i forhold til fritekstsøgning, men de hjælper på ingen måde søgeren med at artikulere sine informationsbehov. Til at guide søgeren rundt i vidensuniverset, og hjælpe til at finde frem til informationsbehovet, er taksonomiens hierarkiske struktur en stor hjælp. Hierarkierne er bygget op af tre basisrelationer 19 : - er en type - er en del af - er et tilfælde af Det gode ved at stille termerne op i relationshierarkier er, at hvis søgeren ikke finder nok brugbar information, kan han bevæge sig op i hierarkiet, og søge på en bredere term. Modsat kan søgeren, hvis han får for meget støj, bevæge sig ned i hierarkiet til en mere specifik term. Problemer med en taksonomi kan opstå, hvis termerne ikke ligger der, hvor søgeren mener de burde ligge. Det er vigtigt for at taksonomien skal opnå og fastholde succes, at brugerne har tillid til den 20. For at forhindre dette problem anbefales det, at en person bliver udvalgt til at have hovedansvaret for vedligeholdelse og opdatering af taksonomien 21, så brugerne kan henvende sig, hvis der er termer der mangler, eller befinder sig på en forkert plads. 22 Det mest komplekse kontrollerede vokabular er tesaurusen. Kernestrukturen her er også hierarkisk, men den strækker sig også videre til at medtage relaterede termer ud over taksonomiens basisrelationer 23. Termerne kan derfor forbindes på tværs af hierarkier, ved at være relaterede ud over taksonomiens bredere/smallere relation. Flere relationer mellem termerne skaber en bedre kontrol over søgningen end nogle af de andre nævnte kontrollerede vokabulerer, men der er også en pris at betale. Tesauruser er svære at vedligeholde, og kræver flere ressourcer end f.eks. en taksonomi eftersom relationerne er mere komplekse. For at strukturere IDAs vidensunivers, har vi derfor som tidligere beskrevet valgt, at konstruere en taksonomi. Til at begynde med forestillede vi os, at taksonomien skulle bruges til at systematisere mappestrukturen på IDAs P-drev. Tanken var, at dette ville give et godt overblik over, hvor forskellige dokumenter lå, ved at man kunne kalde mappen for netop det indholdet omhandlede. Dette viste sig desværre at ikke holde i praksis, da denne metode ikke ville kunne opretholde en høj 18 Mere om precision og recall i afsnitttet omhandlende tildeling af emneord. 19 Stewart, D. L. (2008), s. 54. 20 Lykke Nielsen, M. (1999), s 526. 21 Ibid. 22 Mere om dette i afsnittet omhandlende eller bare et sidetal 23 Stewart, D. L. (2008), s. 57. 11

genfinding, når systemet indeholdt et stort antal dokumenter. Kort fortalt vil systemet miste sin værdi så snart der kommer for mange dokumenter under en term i taksonomien, fordi man så skulle lede efter dokumenterne i lister af andre dokumenter med samme specifikationer. Det enkelte dokument vil således blive nærmest usynligt i mængden af andre lignende dokumenter, og man får en lav precision i søgningen. Desuden havde man allerede forsøgt det i en af afdelingerne, og resultatet var, at den mappestruktur ikke blev brugt. Vi lagde os derefter fast på, at termerne i taksonomien skulle bruges som emneord. På denne måde vil man kunne tillægge flere emneord, hvorimod hvert dokument ville blive gemt under en enkelt term, hvis vi havde valgt, at bruge taksonomien til en mappestruktur. Ved brug af flere emneord vil vi få en højere precision i søgningen. Overvejelserne omkring, hvordan taksonomien skal fungere og se ud, bygger hovedsageligt på teorier omkring taksonomikonstruktion og, mere generelt, omkring konstruktion af kontrollerede vokabularer. Da der ikke findes nogen taksonomi-standard, er det mere anbefalede retningslinjer vi følger 24. Hvor teorierne er modstridende, eller på anden måde åbner op for fortolkning, har vi taget udgangspunkt i hvad vi mener, vil være bedst i den konkrete situation - dvs. tildeling af emneord til IDAs dokumenter - ud fra den viden, vi har opnået gennem brug af metoderne. Termindsamling (HCKH) Det overordnede formål med at indeksere og/eller klassificere er, at kunne genfinde dokumenter ud fra deres emne. For at kunne genfinde et dokument ud fra forskellige kriterier (f.eks. forfatter, titel eller emne), må der udarbejdes en dokumentrepræsentation. Med andre ord en post, der beskriver dokumentets data og som kan hentes frem i stedet for hele dokumentet. Ved valg af begreber, bør det overordnede kriterium være et begrebs mulige værdi som indikator for et dokuments emne. Hvad angår emnets bestemmelse, hersker der en manglende konsensus i indekseringsteoretisk litteratur, og der findes således flere forskellige (videnskabsteoretiske) måder at gribe det an på. 25 Oftest vil indekseringsprocessen være en blanding af disse tilgange, dvs. at man mere eller mindre kan sammensætte de forskellige komponenter, så det passer til organisationens behov. Vi har således valgt, at anvende flere forskellige metoder til termindsamlingen. Disse bliver beskrevet senere i dette afsnit. Når man vælger de begreber, der skal udtrykke et dokuments emne, må man holde sig formålet med databasen for øje. Begreberne ekshaustivitet 26 (indekseringsdybde) og specificitet 27 (detaljeringsgrad) udtrykker, hvor omfattende og detaljeret, man ønsker at registrere et dokument, hvilket igen er knyttet til organisationens behov. Med andre ord, er man kun interesseret i bestemte facetter af et dokuments emne, eller ønsker man en fuldstændig registrering. Ligeledes kan man være mere eller mindre detaljeret i udtrykket af et emne. Indekseres et dokument om psykisk arbejdsmiljø under termen arbejdsmiljø, er det udtryk for lav specificitet, og indekseres det omvendt som psykisk arbejdsmiljø for statsansatte civilingeniører, er det udtryk for høj specificitet. 24 Levy, T. (2004), s. 2. 25 Jens-Erik Mai beskriver i artiklen Deconstructing the Indexing Process en række af disse måder, men det ligger uden for denne opgaves fokus, at beskrive dem nærmere her. 26 Lancaster, F. W. (1998), s. 23. 27 Ibid, s. 19. 12

Stewart anbefaler, at man begynder at udforme taksonomien, når man har en pulje på 100-500 termer. 28 I de følgende afsnit vil vi beskrive og forklare de metoder vi har valgt at anvende til denne dataindsamling, samt hvad vi fik ud af, at anvende dem. Indsamling af termer fra IDA Det første vi gjorde i dataindsamlingsfasen var, at kigge på de eksisterende vokabularer, der allerede fandtes i IDA. Disse ressourcer afspejler, hvordan medarbejderne interagerer med informationsressourcerne indenfor IDA. Det er vigtigt, at anvende termer, som bliver brugt internt i organisationen. 29 De links og labels, der bliver brugt på intranettet og på hjemmesiden, repræsenterer et ad-hoc -forsøg på en termstandardisering, selv om de selvfølgelig ofte udelukkende repræsenterer administratorens tanker. Det samme gør sig gældende for organisationens hjemmeside. Dette giver mulighed for, at finde frem til interne terminologier. Derfor er titler, navigationsknapper og pulldown-menupunkter, fra både interne og eksterne websider, gode ressourcer for termer. Vi fik adgang til IDAs intranet, medlemslogin til ida.dk og IDAs fællesdrev (P-drevet). Vi fik også udleveret lister over emneord de tidligere havde benyttet i deres journalsystem, samt de emneord de benytter på deres dokumenter omhandlende nyheder og arrangementer. 30 Derudover har vi brugt søgefunktionen på IDAs hjemmeside til at lokalisere endnu flere termer. Var vi i tvivl om, hvad en term dækkede over, eller indeholdt af underemner, foretog vi en søgning. Denne metode gav en masse termer, som vi første omgang ikke havde fået øje på. Denne metode viste sig, at være den mest givtige, og gav os en masse gratis termer. Samtidig gav disse allerede eksisterende vokabularer os en idé om den struktur, der er i organisationen, og gjorde, at vi kunne danne os et overblik over domænet. Dette hjalp os til at identificere, hvilke dokumenter, og klasser af dokumenter, der er vigtigst for brugerne. Interviews Det overordnede formål med vores interviews var, at få en idé om, hvad de arbejder med rundt om i de forskellige afdelinger, og få sat nogle ord på det. Tanken var, at finde termer til vores concept map, og i sidste ende til selve taksonomien. Desuden mente vi, at interviewene kunne bruges som et testværktøj til taksonomien. At man ud fra interviewene kunne opstille nogle test-scenarier, så man kunne teste, om lige netop disse dokumenter kunne beskrives ved hjælp af taksonomien. Vi valgte at foretage individuelle interviews, fordi de gav os mulighed for, at komme i dybden med spørgsmålene, og fordi det med én respondent er nemmere at aflæse, hvornår et emne er uddebatteret, og hvornår der er mulighed for, at komme et spadestik dybere. 31 28 Stewart, D. L. (2008), s. 99. 29 Lykke Nielsen, M. (2004), s. 15. 30 Se metodeafsnittet. 31 BAR-eva.dk. (2005b). 13

Det overordnede kriterium for udvælgelse af respondenter til en kvalitativ undersøgelse er relevans. 32 Her støttede vi os meget til vores kontaktperson hos IDA, fordi hun havde kendskab til, hvem i de enkelte afdelinger, det ville være relevant at interviewe. Vores interviewguide 33 består af 12 spørgsmål, som er rangeret så de kommer i en naturlig rækkefølge. Der er udelukkende tale om spørgsmål omhandlende konkrete arbejdsforhold. Hvert interview var sat til at vare 20-30 minutter, og denne tidsplan viste sig at holde. Interviewguiden hviler på en eksplorativ tilgang. Det vil sige, at guiden skal opfattes som en ramme, der skitserer interviewets forløb. Interviewguiden satte os derfor i stand til, på en gang at bevare formål og struktur, ved kritisk at forfølge svarene, samtidig med, at sikre en vis spontanitet og åbenhed under forløbet. Således, at vi kunne indhente uforudsete kommentarer fra brugerne. 34 Vi var begge til stede under interviewene, og rent praktisk gjorde vi det, at den ene stillede spørgsmålene, mens den anden noterede svarene. 35 Dette gjorde, at intervieweren kunne koncentrere sig om interviewets afvikling. I stedet for at optage interviewene, valgte vi udelukkende, at skrive stikordsreferater af dem. Dette gjorde vi, for ikke at anvende for mange ressourcer til bearbejdningen af interviewene. Både fordi der ikke var behov for at gå så meget i dybden, og fordi vi ikke havde behov for at citere fra interviewene. 36 Når det var muligt, blev interviewene foretaget på medarbejdernes egen arbejdsplads. Dette gjorde, at de kunne vise os eksempler fra deres arbejde, samtidig med, at de svarede på spørgsmålene. Dette gav os en god forståelse for deres arbejdssituation, og vi kunne se de problemer de havde med at finde information. 37 Når det ikke var muligt, blev interviewene foretaget på det kontor, vi havde fået stillet til rådighed. Inden hvert interview informerede vi respondenterne om formålet med, og emnet for interviewet. Vi stillede direkte spørgsmål, og hvis respondenterne kom ud af en tangent, forsøgte vi at få dem tilbage på sporet igen. Nogle gange gav disse tangenter dog gode resultater, og hvis respondenterne begyndte at svare på tidligere spørgsmål, afbrød vi dem selvfølgelig heller ikke. Interviewene gav os nogle gode termer, og var også til hjælp, da vi skulle validere rigtigheden af de termer vi allerede havde valgt. Respondenternes svar fortalte os noget om, hvad man må kunne forvente, at dokumenterne der produceres rundt omkring i de forskellige afdelinger omhandler. Ud fra dette kunne vi foretage prøveindeksering af fiktive dokumenter, og fik dermed et indblik i, om de kunne beskrives med taksonomien. En vigtig sidegevinst ved disse interviews var, at vi kom rundt i de forskellige afdelinger, og præsenteret os selv og taksonomien, så de kommende brugere blev inddraget i processen med at skabe en taksonomi som de i sidste ende selv skal bruge. 32 BAR-eva.dk. (2005a). 33 Se bilag??? 34 Interviewguiden er baseret på Steiner Kvales Interview En introduktion til det kvalitative forskningsinterview, 1998 forbandet vrøvl!!! 35 Da der således udelukkende er tale om noter, er disse interviews ikke vedlagt opgaven. 36 BAR-eva.dk. (2005a). 37 BAR-eva.dk. (2005b). 14

Ordoptælling Ikke alle metoder viste sig, at være brugbare. Vi ønskede, at foretage en ordoptælling på en række eksemplariske dokumenter. Resultaterne fra denne ordoptælling ville vi bruge som et supplement til de andre metoder. Eksemplariske dokumenter, er dokumenter, der beskriver eller viser den intellektuelle struktur indenfor et bestemt domæne. 38 Derved kan de fungere som udgangspunkt for et indekseringsvokabular for det område, og endnu vigtigere så giver de en narrativ kontekst i hvilken disse termer giver bedre mening. Derfor er det nemmere, at konstruere et indekseringssprog ud fra eksemplariske dokumenter, end det er, at gøre det fra bunden. I vores tilfælde ville et eksemplarisk dokument altså være et dokument, der viser strukturen og arbejdsgangene indenfor en bestemt afdeling. Udfra en række kriterier vi havde formuleret, ville vi udvælge de eksemplariske dokumenter fra IDAs fællesdrev, det såkaldte P-drev. Disse dokumenter ville vi derefter samle efter afdelinger, så vi nåede op på ca. 5000 ord pr. afdeling. Fordelen ved at samle dokumenterne efter afdeling var, at vi herved både kunne benytte korte såvel som lange dokumenter i ordoptællingen. Zipfs lov foreskriver, at korpusset af ord, skal bestå af min. 5000 ord, for at resultatet er brugbart. 39 Dette tekstkorpus ville vi herefter køre gennem ordoptællingsprogrammet Textalyser 40, der tæller forekomsten af ord. Programmet udstyrede vi med en stopordsliste, der indeholdt præpositioner, pronominer, adverbier og de mest frekvente verber. Denne skulle bruges til, at sortere højfrekvente ord som f.eks. og, som og eller fra. Rent praktisk foregår denne ordoptælling ved, at programmet tæller ord- eller frasefrekvenser i dokumentet, og rangerer dem i forhold til deres forekomst. De ord der optræder flest gange, anses sædvanligvis som mest relevante og kommer til at optræde som emneord. Der kan også anvendes en stemmer, dvs. en funktion der faciliterer søgning på ordstammerne. Ord eller fraser der optræder hyppigt i et dokument, optræder måske også hyppigt i hele basen og bliver derfor mindre signifikante at søge på. Man kan i denne forbindelse vægte ord eller fraser i forhold til, hvor signifikante de er. Dette kaldes relativ frekvens. Gode diskriminerende termer vil således være dem, der optræder forholdsvist sjældent i databasen. For at udpege disse eksemplariske dokumenter, prøvede vi først at danne os et overblik over mappestrukturen på P-drevet, ved at udfolde alle mapperne. Men det viste sig, at være et for stort og uoverskueligt projekt, da vi efter at have udfoldet Analyse-afdelingens mapper fandt ud af, at den indeholder 1182 undermapper. Analyse-afdelingen er kun den ene af 24 mapper inden for mappen Afdelinger, som igen er den ene af ni overmapper. 41 Selvom alle disse mapper måske ikke er lige så store, ville det være et kæmpearbejde, alene at skabe sig et overblik. Derfor droppede vi den tanke. Men vores optælling illustrerer meget godt, hvor uoverskueligt og svært tilgængelige dokumenterne er hos IDA i dag. 38 Blair, D. C., & Kimbrough, S. O. (2001), s. 366. 39 Wyllys, R. E. (1981), s. 55-56. 40 Textalysers hjemmeside: http://textalyser.net/ 41 Ganger man dette regnestykke op, giver det 255.312 mapper i alt! Om tallet så reelt er større eller mindre ved vi ikke, da vi ikke ved, om Analyse-afdelingen har mange eller få mapper i forhold til de andre afdelinger. 15

I udgangspunktet virkede det til at være en god metode, og derfor har vi brugt en del tid på, at få den til at fungere. Men når informationerne er så ustruktureret lagret, og databasen er så stor (477 GB), som det er tilfældet hos IDA, har vi ikke mulighed for at gennemgå samtlige dokumenter. Derfor bliver det for tilfældigt, hvilke dokumenter vi udvælger, og i sidste ende, hvilke ord vi kommer frem til ved ordoptællingen. Vi har således ikke nogen chance for at vurdere, i hvilken grad de er dækkende, eller hvor dybt ned i de enkelte afdelinger vi egentlig kommer med de dokumenter vi udvælger. Dette er et godt eksempel på, at teori ikke altid let lader sig overføre til praksis. Det bedste havde været, hvis vi i samarbejde med de enkelte afdelinger havde udvalgt de eksemplariske dokumenter. Det tillod tiden dog ikke, og desuden er det ikke sikkert, at de ville kunne udpege eksemplariske dokumenter, der fanger essensen af, hvad den pågældende afdeling arbejder med. Design og udformning af taksonomien (LH) Efter således at have indsamlet termer, er næste fase selve udformningen og konstruktionen af taksonomien. I dette afsnit vil vi beskrive, hvordan vi har grebet denne fase an, dvs. hvordan vi har struktureret disse termer i grupper, og de tanker der ligger bag. Taksonomiens opbygning Det øverste niveau i taksonomien er det, vi har lagt mest vægt på. Dette er indgangen til taksonomien, og for at de underliggende niveauer skal fungere hensigtsmæssigt ser vi det som vigtigt, at termerne i det øverste niveau er præcist formuleret. Undervejs i arbejdet med taksonomien har vi ændret navn på termerne i det øverste niveau, efterhånden som vi har fået flere termer, og en større viden om IDA. Dette ser vi ikke på som noget problem, snarere tvært imod. Selve arbejdet med at sætte termerne ind i taksonomiens struktur har givet os værdifuld viden om domænet. I udarbejdelsen af det øverste niveau har vi baseret os løst på Ranganathan's fem klassiske facetter, kaldet PMEST. Det er tanken om at opdele et område i gensidigt udelukkende facetter vi ser som nyttige. Den grundlæggende pointe er, at identificere nogle få gensidigt udelukkende kategorier, og skabe et hierarki for hvert af dem 42. Vi vurderede, at den klassiske PMEST (Personality, Matter, Energy, Space og Time) ikke ville fungere så godt i vores specifikke tilfælde 43. Vi havde svært ved at få PMEST-facetten Time til at passe ind, og da denne ene facet faldt ud, kom vi frem til, at vi ville skabe vore egne termer udfra de termer, vi havde hentet fra IDA. Stewart siger også, at man ikke er bundet til at bruge PMESTfacettene, men at man finder de passende termer fra den information man er i færd med at organisere 44. Derfor definerede vi fem termer udfra de termer, vi havde samlet ind, og den viden vi har oparbejdet om IDA. De termer vi er kommet frem til i det overordnede niveau, er: - Medlemmer 42 Stewart, D. L. (2008), s. 61. 43 Ibid, s. 62. 44 Ibid. 16

- Videndeling - Dokumenttype - IDA - Andre samarbejdspartnere. Medlemmer er den term, der optræder først, fordi det er medlemmerne der er det centrale for IDA. Herunder kommer de termer, der relaterer sig til IDAs medlemmer. Det er meningen, at dokumenter der omhandler medlemmer skal indekseres med emneord der forklarer, hvilken type medlemssager dokumentet hovedsagligt omhandler. Indeksøren 45 kan frit vælge udelukkende at bruge emneord fra denne kategori, på forskellige eller samme niveau, eller kombinere med termer fra andre overordnede kategorier. Medlemmer er den eneste term vi har beholdt gennem hele processen, da vi anser denne for at være den mest centrale. Videndeling er den kategori, hvor medarbejdere møder hinanden på en eller anden måde, og udveksler viden med hinanden. Det kan være et personalemøde, et seminar, eller rådgivning. Hvis et dokument omhandler videndeling på en eller anden måde mellem medarbejdere i IDA, kan indeksøren vælge at bruge en term fra denne kategori som emneord. Denne kategori blev tidligere kaldt Aktiviteter, men blev ændret, da denne term kunne misforstås. Dokumenttype blev tidligere kaldt for Materiale. Denne term definerer vi som værende typen af materialer det gældende dokument er. Ved at bruge emneord fra denne kategorien, kan man således fortælle søgeren, hvad dokumentet er blevet brugt til. Er der tale om et brev, en personalehåndbog eller et direktiv? Vi forestiller os, at disse emneord typisk bliver brugt til at beskrive dokumenter, der hovedsagligt har en rolle som en bestemt materialetype. I kategorien IDA har vi lagt termer for alle IDAs afdelinger og regionale netværk. Hvis et dokument omhandler, eller på anden måde burde forbindes med en af IDAs afdelinger eller kontorer rundt i landet, kan indeksøren vælge at indeksere med en term fra denne kategori. Andre samarbejdspartnere kan, sammen med kategorien IDA, sammenlignes med PMESTfacetten Space. Der er tale om et eksisterende sted eller en organisation, hvor en handling kan finde sted. Vi har valgt, at adskille disse for ikke at sammenblande IDAs interne afdelinger og kontorer med de eksterne samarbejdspartnere. I de underliggende niveauer bliver termerne så mere og mere specialiserede. Tanken er, at de underordnede niveauer skal dække alle aspekter af de overordnede. F.eks. skal alle termer under Medlemmer dække alt, der har med medlemmer at gøre. Termerne i det øverste niveau er ikke opstillet alfabetisk, men efter hvor vigtige vi anser kategorierne for at være i forbindelse med indeksering. Det er vigtigt at påpege, at denne opstilling er vor egen, og godt kan ændres inden taksonomien er færdig til brug. For at verificere, at de termer vi har valgt er brugbare for IDA, må vi tage de ansatte med i udformningen. I afsnittet Kvalitetskontrol og testning af taksonomien vil vi forklare nærmere om, hvilke metoder vi anser for at være de bedste til dette formål. 45 Hvad enten dette er en person, eller processen bliver varetaget automatisk. 17

For at lette genfindingen, er niveauerne under det øverste niveau er opstillet alfabetisk. Længere lister med ord bliver hurtigt uoverskuelige, og ved konsekvent at opstille termerne efter et system, man må antage at alle kender, håber vi at få brugeren af taksonomien til at føle sig «hjemme» i systemet. Alfabetisk rækkefølge må være den mest gennemskuelige systematiseringen af ord, og vil efter vores mening bidrage med øget intuitivitet i systemet. Igen vil vi påpege, at det er meningen brugerne skal være med til at bestemme udformningen. Vi har lagt vægt på, at termerne skal være gensidigt udelukkende, dvs. vi ønsker ikke at nogen term skal optræde mere end én gang. Dette er for at skabe konsistens i taksonomiens struktur, og dermed undgå forvirring. 46 Hvis det øverste niveau er grundigt gennemtænkt, burde det heller ikke være nødvendigt med gentagende termer, hvorfor vi har lagt så stor vægt på dette niveau. Det er meningen, at taksonomien skal være intuitiv for brugeren, og vi har derfor valgt at forsøge at holde hver termliste i en kategori på maksimalt 15 termer. Dette gør vi, for at brugeren skal kunne holde taksonomiens overordnede struktur, og samtidig finde frem til de detaljerede termer 47. Det er vigtigt, at brugeren af taksonomien til hver en tid har nok forståelse for taksonomiens opbygning til at kunne træffe sit næste valg, og også finde tilbage uden problemer. Der er en grænse for, hvor mange ting man kan holde i hovedet. 48 Det er dette vi tager højde for, når vi konstruerer taksonomien ud fra et ønske om, at have maksimalt 15 termer i en termliste. Psykologen George Miller fandt gennem sine studier det magiske tal 7 ± 2, som er det antal ting vi kan: - være opmærksomme på samtidig - holde i korttidshukommelsen - skille klart fra hinanden Miller fandt også ud, at hvis man holdt mere end 15 ting i hovedet samtidig, ville fejlmarginen blive for stor 49. Der findes en strategi til at narre hjernen til at huske flere ting, nemlig ved at gruppere dem sammen. Det er lige præcis denne strategi en taksonomis hiararkiske struktur benytter sig af 50 ; termerne er grupperet under sin forældreterm. Derfor vil det være muligt for en bruger af taksonomien, at holde hele strukturen i hovedet så længe vi holder os indenfor grænsen på 15 termer. Vi har holdt os til 5 termer i det øverste niveau, netop for at optimere brugerens interaktion med strukturen. De underliggende niveauer efterstræber vi at holde på maksimalt 15 termer. Nogle steder i taksonomien har vi desværre været nødt til at lave termlister på mere end 15. Dette er under Uddannelse og Fagtekniske netværk, som vi må antage de ansatte i IDA har kenskab til. I lister med termer, som man må antage at brugerne af taksonomien har kendskab til, er det muligt at have flere end 15 termer, uden at det går ud over evnen til at navigere 51. 46 Lambe, P. (2007), s. 20. 47 Lambe, P. (2007), s. 186. 48 Ibid, s. 186. 49 Ibid, s. 187. 50 Ibid, s. 190. 51 Ibid. 18

Vores taksonomi består af 5 niveauer. Lambe anbefaler udfra Miller og Dunbars magiske tal, at man ikke har mere end 3 nivauer, da man herefter begynder at miste overblikket, og navigeringen kan bryde sammen 52. Men dette er kun anbefalinger, og ikke fastlagte regler. Vi har valgt, at lade vores taksonomi strække sig over 5 niveauer, og mener dette vil fungere fint, eftersom IDAs ansatte må antages, at have et grundlæggende kendskab til termerne, og har brug for en vis specificitet. Såfremt termerne er opstillet i et godt system, vil brugerne af systemet ikke miste overblikket. En anden pointe er, at Lambe regner med, at listerne er fyldt op med 15 termer i hver, noget vores taksonomi ikke er. Selv om der er 5 niveauer, har vi holdt os godt under det antal termer, den menneskelige hjerne kan arbejde med i 3 niveauer (3.375) 53. Under opbygningen af de fem niveauer har vi hele tiden holdt relationsforholdet i tankerne. Vi har brugt alle de tre typer relationer som en taksonomi kan indeholde 54, men vi har lagt vægt på, at relationerne skal være de samme indenfor en kategori for at vedholde konsistens. Eftersom det kun er et udkast til en taksonomi vi har konstrueret, skal disse relationer revideres inden taksonomien kan tages i brug. Vi forestiller os, at det bedst gøres i samarbejde med dem som skal bruge taksonomien, eftersom det er dem, der har den mest indgående viden om IDA og hvilke relationer termerne burde have. De ni nøglekriterier Til konstruktionen af taksonomien, har vi anvendt ni nøglekriterier for udformningen af robuste taksonomistrukturer. 55 Disse kriterier komplementerer og forstærker hinanden, og skal sikre, at taksonomien er internt konsistent, meningsfuld for brugerne, nem at navigere i, og varetager sin vigtigste opgave: At opdele store mængder indhold i mindre dele, der er nemme at navigere rundt i. De ni nøglekriterier er, at taksonomien skal være: Intuitiv Entydig Åben Konsistent og forudsigelig Relevant Sparsommelig Meningsfuld Holdbar Balanceret Disse ni nøglekriterier, samt hvordan man sikrer sig, at taksonomien overholder dem, bliver beskrevet nedenfor. Nogle af disse kriterier kan man teste for, ved at lade testbrugere indeksere en række dokumenter vha. taksonomien, mens andre kan testes ud fra den daglige brug af taksonomien. At taksonomien skal være intuitiv at anvende betyder, at den skal være nem at navigere i og bruge. Brugerne skal således kunne forudsige, i hvilke kategorier de kan finde de termer, de ønsker at 52 Lambe, P. (2007), s, 190. 53 Ibid, s. 191. 54 Se Planlægningsfasen 55 Ibid, s. 199-200. 19

anvende. Om det er intuitivt for brugerne at anvende taksonomien kan man teste ved at observere, om de hurtigt navigerer frem til det, de søger, uden at gå i blindgyder. Med entydig menes der, at taksonomien ikke skal tilbyde alternativer. Brugeren må ikke være i tvivl om, hvilket ord, der er det rigtige. De enkelte termer må derfor ikke findes mere end ét sted i taksonomien. For at teste, om taksonomien er entydig, kan man se på, om brugerne med det samme kan identificere de termer de ønsker at bruge, uden først at overveje alternativer. Åben betyder, at taksonomien skal kunne supportere alt indhold. Taksonomien skal således kunne rumme nyt indhold, uden at det er nødvendigt med omfattende ekspansioner eller omstruktureringer. For at sikre sig, at taksonomien er åben, skal man sørge for, at der ikke er store samlekategorier med blandet indhold. Det er her vigtigt i fællesskab med domænespecialister at overveje, om fremtidigt indhold kan implementeres i de allerede eksisterende kategorier. At taksonomien skal være konsistent og forudsigelig betyder, at underkategorierne skal organiseres således, at det er nemt og logisk for brugerne, at navigere rundt. For at opnå dette, har vi valgt, at opstille alle termer, på nær dem på det øverste niveau alfabetisk. Dermed kan indeksøren forholde sig til et fast system. Om taksonomien er konsistent og forudsigelig kan man teste ved at observere, om brugerne indenfor de enkelte kategorier hurtigt kan navigere hen til den term eller underkategori de søger, uden først at skulle læse hele listen systematisk igennem. Med relevant menes der, at taksonomien ud fra et brugerperspektiv bør genspejle de måder, man normalt organiserer information og viden på i organisationen. For at teste, om taksonomien er relevant, kan man se på, om de søgetermer eller fraser som brugerne anvender i deres søgninger, umiddelbart kan oversættes til en del af taksonomien. F.eks. referat fra Hovedbestyrelsesmøde omhandlende IDA Forsikring. Dette kan man gøre, ved at undersøge log-filerne fra søgefunktionen. Sparsommelig betyder, at der ikke må være nogen gentagelser. Taksonomiens struktur skal hverken tilbyde mere eller mindre end påkrævet. Der kan her opstå et spændingsfelt med, at taksonomien samtidig skal være åben. For at taksonomien skal være sparsommelig, bør man sikre sig, at den ikke indeholder kategorier uden indhold. Desuden bør der ikke være kategorier, som er overfyldt med indhold. At taksonomien skal være meningsfuld betyder, at kategorier og underkategorier skal sætte brugeren i stand til, at kunne forudsige, hvad de indeholder. Man sikrer sig, at taksonomien er meningsfuld ved at sørge for, at brugerne ikke bliver overraskede eller direkte skuffede over det indhold, de finder i underkategorierne eller emnefolderne. Med holdbar menes der, at taksonomien skal konstrueres således, at den ikke behøver hyppige ændringer eller ekspansioner. En robust taksonomi kræver generelt kun en mindre revision en gang om året, medmindre der sker radikale og uforudsete ændringer i organisationen. Mere om dette senere under kapitlet om vedligeholdelse af taksonomien. Holdbarhed er noget, der testes over tid. For at taksonomien er holdbar eller robust, skal der ikke være nogen seriøse, eller gentagne klager fra brugerne, fordi de ikke kan tildele nyt indhold. Eller fordi de har svært ved at navigere. At taksonomien skal være balanceret betyder, at hvert niveau har en konsistent grad af generalitet og specificitet, når man sammenligner horisontalt gennem taksonomien. For at taksonomien er 20