Internetsøgemaskiner
|
|
- Line Kristensen
- 7 år siden
- Visninger:
Transkript
1 Internetsøgemaskiner Gerth Stølting Brodal Datalogisk Institut Aarhus Universitet Ungdommens Naturvidenskabelige Forening Ålborg, 27. februar
2 Overblik Indledning Google facts Internetgrafen En søgemaskines dele Crawling Indeksering Søgning og ranking Afslutning 2
3 Internettet Meget stor mængde ustruktureret information. Hvordan finder man relevant info? Søgemaskiner! 94: Lycos,... 96: Alta Vista: mange sider. 99: Google: mange sider og god ranking. 3
4 Søgemaskinernes Barndom princess diana Engine 1 Engine 2 Engine 3 Relevant and high quality Relevant but low quality Not relevant index pollution [Fra: Henzinger, 2000] 4
5 ... og Søgemaskiner i
6 Moderne Søgemaskiner Imponerende performance. F.eks. Google: Søger i sider. Svartider 0,1 sekund brugere i sekundet. Finder relevante sider. 6
7 Internetsøgninger i USA (maj 2004) [Fra: 7
8 Overblik Indledning Google facts Internetgrafen En søgemaskines dele Crawling Indeksering Søgning og ranking Afslutning 8
9 Startet i 1995 som forskningsprojekt ved Stanford University af ph.d. studerende Larry Page og Sergey Brin Privat firma grundlagt medarbejdere Ansvarlig for ca. halvdelen af alle internet-søgninger Hovedsæde i Silicon Valley google googol =
10 Søgemaskine Hurtig Relevante links Opdateret Cache GoogleScout (lignende sider) Automatisk stavekontrol Interface til WAP og PDA Produktsøgninger (froogle) Billed søgning Aktiekurser, kort, ordbøger, nyheder, telefonbøger... Stemmestyret teknologi AdWords tekstbaseret reklame query afhængig Licenser AOL/Netscape, Red Hat, Virgin Group, YAHOO, The Washington Post... Web API Hardware + Software 10
11 web sider (+20 TB) PageRank: sider og links ikke HTML sider USENET beskeder (20 år) billeder +2 Terabyte index, opdateres en gang om måneden termer i indeks søgninger om dagen (2000 i sekundet) +200 filtyper: HTML, Microsoft Office, PDF, PostScript, WordPerfect, Lotus sprog 11
12 Cluster af Intel servere med Linux Single-processor 256 MB 1 GB RAM 2 IDE diske med Gb Fejl-tolerance: Redundans Hastighed: Load-balancing 12
13 Overblik Indledning Google facts Internetgrafen En søgemaskines dele Crawling Indeksering Søgning og ranking Afslutning 13
14 Internetgrafen knuder = sider (URL er) orienterede kanter = links 14
15 Overblik Indledning Google facts Internetgrafen En søgemaskines dele Crawling Indeksering Søgning og ranking Afslutning 15
16 Life of a Google Query [Fra: 16
17 En søgemaskines dele Indsamling af data: Webcrawling (gennemløb af internetgrafen). Indeksering data: Parsning af dokumenter. Lexicon: indeks (ordbog) over alle ord mødt. Inverted file: for alle ord i lexicon, angiv i hvilke dokumenter de findes. Søgning i data: Find alle dokumenter med søgeordene. Rank dokumenterne. 17
18 Opbygning af en Søgemaskine [Fra: Arasu et al., 2001] 18
19 Overblik Indledning Google facts Internetgrafen En søgemaskines dele Crawling Indeksering Søgning og ranking Afslutning 19
20 Crawling Webcrawling = Grafgennemløb S = {startside} repeat fjern en side s fra S parse s og find alle links (s,v) foreach (s, v) if v ikke besøgt før indsæt v i S 20
21 Designovervejelser Startpunkt (initial S). Crawl-strategi (valg af s). Mærkning af besøgte sider. Robusthed. S = {startside} repeat fjern en side s fra S parse s og find alle links (s,v) foreach (s, v) if v ikke besøgt før indsæt v i S Ressourceforbrug (egne og andres ressourcer). Opdatering. Kontinuert vs. periodisk crawling. Output: DB med besøgte dokumenter. DB med links i disse (kanterne i Internetgrafen) DB med DokumentID URL mapning 21
22 Crawl-strategier Breath First Search Depth First Search Random Priority Search Mulige prioriteter: Sider som opdateres ofte (kræver metode til at estimatere opdateringsfrekvens). Efter vigtighed (kræver metode til at estimere vigtighed, f.eks. PageRank). 22
23 BFS virker godt Average PageRank Day of crawl Average day top N pages were crawled e+06 1e+07 1e+08 top N Figure 1: Average PageRank score by day of crawl Figure 2: Average day on which the top N pages were crawled [Fra: Najork and Wiener, 2001] Fra et crawl af 328 millioner sider. 23
24 PageRank prioritet er endnu bedre (men mere beregningstung... ) Hot pages crawled 100% 80% 60% 40% Ordering metric: PageRank backlink breadth random 20% 0% 0% 20% 40% 60% 80% 100% Pages crawled Figure 2: The performance of various ordering metrics for IB(P); G = 100 [Fra: Arasu et al., 2001] Fra et crawl af sider på Stanford University. 24
25 Robusthed Normalisering af URLer. Parsning af malformet HTML. Mange filtyper. Forkert content-type fra server. Forkert HTTP response code fra server. Enorme filer. Uendelige URL-løkker (crawler traps).. 25
26 Robusthed Normalisering af URLer. Parsning af malformet HTML. Mange filtyper. Forkert content-type fra server. Forkert HTTP response code fra server. Enorme filer. Uendelige URL-løkker (crawler traps).. Vær konservativ opgiv at finde alt. Crawling tager måneder brug checkpoints. 25
27 Ressourceforbrug Egne ressourcer Båndbredde (global request rate) Lagerplads (brug kompakte representationer) Distribuér på flere maskiner (opdel f.eks. rummet af ULR er) 26
28 Ressourceforbrug Egne ressourcer Båndbredde (global request rate) Lagerplads (brug kompakte representationer) Distribuér på flere maskiner (opdel f.eks. rummet af ULR er) Andres ressourcer (politeness) Båndbredde (lokal request rate). Tommelfingerregel: 30 sekunder mellem request til samme site. Robots Exclusion Protocol ( Giv kontakt info i HTTP-request. 26
29 Erfaringer ang. effektivitet Brug caching (DNS opslag, robots.txt files, senest mødte URL er). Flaskehals er ofte I/O under tilgang til datastrukturerne CPU cycler er ikke flaskehals (Java og scripting languages er OK). En tunet crawler (på een eller få maskiner) kan crawle sider/sek 35 mio sider/dag. 27
30 Statistik 200 OK (81.36%) 404 Not Found (5.94%) 302 Moved temporarily (3.04%) Excluded by robots.txt (3.92%) TCP error (3.12%) DNS error (1.02%) Other (1.59%) Figure 6: Outcome of download attempts text/html (65.34%) image/gif (15.77%) image/jpeg (14.36%) text/plain (1.24%) application/pdf (1.04%) Other (2.26%) Figure 7: Distribution of content types 15% 10% 5% K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M Figure 8: Distribution of document sizes [Fra: Najork and Heydon, 2001] 28
31 Overblik Indledning Google facts Internetgrafen En søgemaskines dele Crawling Indeksering Søgning og ranking Afslutning 29
32 Indeksering af dokumenter Opgave: Preprocessér en dokumentsamling så dokumenter med et givet søgeord kan blive returneret hurtigt. Input: dokumentsamling. Output: søgestruktur. 30
33 Indeksering: Inverted file + lexicon Inverted file = for hvert ord w en liste af dokumenter indeholdende w. Lexicon = ordbog over alle ord i dokumentsamlingen. (key = ord, value = pointer til liste i inverted file + evt. ekstra info for ordet, f.eks. længde af listen) For en milliard dokumenter: Inverted files totalt antal ord 100 mia Lexicon antal forskellige ord 2 mio Disk RAM 31
34 Lexicon Kan være i RAM, så almindelige ordbogs-datastrukturer er OK. F.eks.: Binær søgning i sorteret liste af ord. Hash tabeller. Tries, suffix træer, suffix arrays. 32
35 Inverted File Simpel (forekomst af ord i dokument): ord 1 : DocID, DocID, DocID ord 2 : DocID, DocID ord 3 : DocID, DocID, DocID, DocID, DocID,.... Detaljeret (alle forekomster af ord i dokument): ord 1 : DocID, Position, Position, DocID, Position.... Endnu mere detaljeret: Forekomst annoteret med info (heading, boldface, anchor text,... ). Kan bruges under ranking. 33
36 Komprimer inverted file Specifikke metoder Gem differencen mellem DocID er (ikke absolutte DocID er). Kod denne difference effektivt. Generiske værktøjer (zip,... ) Komprimer hver liste. Opdel lister i blokke, komprimer hver blok. 34
37 Parsning af dokumenter Find ord Fjern mark-up, scripts,... Definition af ord? (sekvens af alfanumeriske tegn, længde max 256, max 4 digits). Lowercase Tegnsæt? ascii, latin-1, Unicode,.... Stemming? ( funktion, funktionalitet,... funktio ). Stop ord? (udelad hyppige ord som og, er,... ). 35
38 Bygning af index foreach dokument D i samlingen Parse D og identificér ord foreach ord w Udskriv (DocID, w) if w ikke i lexicon indsæt w i lexicon (1, 2), (1, 37),..., (1, 123), (2, 34), (2, 37),..., (2, 101), (3, 486),... Disk sorting (22, 1), (77, 1),..., (198, 1), (1, 2), (22, 2),..., (345, 2), (67, 3),... inverted file 36
39 Overblik Indledning Google facts Internetgrafen En søgemaskines dele Crawling Indeksering Søgning og ranking Afslutning 37
40 Søgning og Ranking Query: computer AND science: 1. Slå computer og science op i lexicon. Giver adresse på disk hvor deres lister starter. 2. Scan disse lister og flet dem (returnér DocID er som er med i begge lister). computer: 12, 15, 117, 155, 256,... science: 5, 27, 117, 119, 256, Udregn rank af fundne DocID er. Hent de 10 højst rank ede i dokumentsamling og returnér URL samt kontekst fra dokument til bruger. OR og NOT kan laves tilsvarende. Hvis lister har ord-positioner kan frase-søgninger ( computer science ) og proximity-søgningner ( computer tæt på science ) også laves. 38
41 Tekstbaseret ranking Vægt forekomsten af et ord med f.eks. Antal forekomster i dokumentet. Ordets typografi (fed skrift, overskrift,... ) Forekomst i META-tags. Forekomst i tekst ved links som peger på siden Forbedring, men ikke nok på Internettet (rankning af f.eks relevante dokumenter). Let at spamme (fyld siden med søge-ord). 39
42 Linkbaseret ranking Idé 1: Link til en side anbefaling af den. Idé 2: Anbefalinger fra vigtige sider skal vægte mere. 40
43 Google PageRank TM websurfer PageRank beregning kan opfattes som en websurfer som (i uendelig lang tid) i hver skridt med 85% sandsynlighed vælger at følge et tilfældigt link fra nuværende side, med 15% sandsynlighed vælger at gå til en tilfældig side i hele internettet. PageRank for en side x er lig den procentdel af hans besøg som er til side x. 41
44 Simpel graf 1 ulige 4 lige ulige 2 ulige 5 lige 3 lige 6 42
45 Simpel graf 1 ulige 4 lige ulige 2 ulige 5 lige 3 lige 6 Metode RandomWalk Start på knude 1 Gentag 25 gange: Kast en terning: Hvis den viser 1-5: Vælg en tilfældig pil ud fra knuden ved at kaste en terning hvis 2 udkanter Hvis den viser 6: Kast terningen igen og spring hen til den knude som terningnen viser 42
46 impel graf Sandsynlighedsfordeling Skridt ulige 1 3 lige 2 ulige ulige 4 6 lige 5 lige
47 Beregning af PageRank PageRank vektoren r er egenvektor for nabomatricen A for internetgrafen (normaliseret, d.v.s. indgangene i række i divideret med udgraden af side i) r = ra Matematisk teori (ergodisk sætning om random walks): For vilkårlig startvektor x: xa k r for k hvis A opfylder visse betingelser. 44
48 Beregning af PageRank For at opfylde betingelser i PageRank: erstat A med 0.85A E, hvor E er en (normaliseret) nabomatrice som indeholder kanter fra alle sider til alle sider. Vægtningen 85 15% er valgt ud fra at den har vist sig god i praksis. Beregning: Gentag r ny = r gl. (0.85A E) I praksis: iterationer er nok. 45
49 46
50 47
51 Overblik Indledning Google facts Internetgrafen En søgemaskines dele Crawling Indeksering Søgning og ranking Afslutning 48
52 [Fra: 9. november 2004] 49
53 Gør-det-selv Programmeringsprojekt i kurset Algorithms for Web Indexing and Searching (Gerth S. Brodal, Rolf Fagerberg), efteråret Opgave: lav en søgemaskine for domæne.dk. 15 studerende. 4 parallelt arbejdende grupper (crawling, indexing, PageRank, søgning/brugergrænseflade). Erfaring: Rimmelig vellykket søgemaskine, hvor rankningen dog kræver yderligere finjustering... 50
54 References Arvind Arasu, Junghoo Cho, Hector Garcia-Molina, Andreas Paepcke, and Sriram Raghavan, Searching the Web. ACM Transactions on Internet Technology, 1, p. 2-43, Sergey Brin and Larry Page, The Anatomy of a Search Engine, Monika Rauch Henzinger, Web Information Retrieval. Proceedings of the 16th International Conference on Data Engineering, Marc Najork and Allan Heydon, High-Performance Web Crawling. Compaq SRC Research Report 173. Marc Najork and Janet L. Wiener, Breadth-First Search Crawling Yields. In Proceedings of the Tenth Internal World Wide Web Conference, ,
Internetsøgemaskiner. Gerth Stølting Brodal Datalogisk Institut Aarhus Universitet
Internetsøgemaskiner Gerth Stølting Brodal Datalogisk Institut Aarhus Universitet 1 Internettet Meget stor mængde ustruktureret information Hvordan finder man relevant info? Søgemaskiner! 94: Lycos,...
Læs mereInternetsøgemaskiner. Gerth Stølting Brodal Datalogisk Institut Aarhus Universitet
Internetsøgemaskiner Gerth Stølting Brodal Datalogisk Institut Aarhus Universitet 1 Overblik Indledning Google facts Internetgrafen En søgemaskines dele Crawling Indeksering Søgning og ranking Afslutning
Læs mereInternetsøgemaskiner
Internetsøgemaskiner Gerth Stølting Brodal Datalogisk Institut Aarhus Universitet Ungdommens Naturvidenskabelige Forening Ålborg, 22. september 2009 1 Internetsøgemaskiner (September 2009) [Fra: marketshare.hitslink.com]
Læs mereInternetsøgemaskiner
Internetsøgemaskiner Gerth Stølting Brodal Datalogisk Institut Aarhus Universitet Ungdommens Naturvidenskabelige Forening i Århus, 9. december 2004 1 Overblik Indledning Google facts Information retrieval
Læs merePerspektiverende Datalogi Internetalgoritmer. Gerth Stølting Brodal
Perspektiverende Datalogi Internetalgoritmer Gerth Stølting Brodal dpersp - Internetalgoritmer Brin, S. and Page, L. (1998) The Anatomy of a Large-Scale Hypertextual Web Search Engine. In: Seventh International
Læs mereSøgemaskiner. Hvordan virker søgemaskinerne på internettet? Gerth Stølting Brodal Datalogisk Institut Aarhus Universitet
Søgemaskiner Hvordan virker søgemaskinerne på internettet? Gerth Stølting Brodal Datalogisk Institut Aarhus Universitet Udviklerkonference, Danske Bank, Brabrand, 23. november 2004 1 2 3 Overblik Indledning
Læs mereSådan virker. (måske) Gerth Stølting Brodal. Datalogisk Institut Aarhus Universitet
Google logo 24. august 2011 Sådan virker (måske) Gerth Stølting Brodal Datalogisk Institut Aarhus Universitet Ungdommens Naturvidenskabelige Forening Aarhus, 25. august 2011 Hvornår har du sidst brugt
Læs merePerspektiverende Datalogi 2011
Perspektiverende Datalogi 2011 Internetalgoritmer Gerth Stølting Brodal Christian S. Jensen Erik Meineche Schmidt Niels Olof Bouvin Internetsøgemaskiner (2. oktober 2011) marketshare.hitslink.com Historiske
Læs mereSådan virker. (måske) Gerth Stølting Brodal. Datalogisk Institut Aarhus Universitet
Sådan virker (måske) Gerth Stølting Brodal Datalogisk Institut Aarhus Universitet 16. maj 2012 Hvornår har du sidst brugt Google? a) Seneste time b) Idag c) Denne uge d) Denne måned e) Aldrig Internetsøgemaskiner
Læs mereSøgemaskiner på Internettet
1 Søgemaskiner på Internettet Gerth Stølting Brodal og Rolf Fagerberg BRICS, Daimi, Aarhus Universitet Foredrag i Datalogforeningen, 29. januar 2003 2 Internettet Meget stor mængde information. Ustruktureret.
Læs merePerspektiverende Datalogi Internetalgoritmer. MapReduce. Gerth Stølting Brodal
Perspektiverende Datalogi Internetalgoritmer MapReduce Gerth Stølting Brodal MapReduce Implementationer Dean, F. and Ghemawat, S. (2004) MapReduce: Simplified Data Processing on Large Clusters. In: Sixth
Læs mereGoogle Pagerank Hvordan man finder en nål i en høstak
Google Pagerank Hvordan man finder en nål i en høstak Georg Mohr, 4. marts 2008 Kim Knudsen kim@math.aau.dk Institut for Matematiske Fag Aalborg Universitet http://www.math.aau.dk/ kim/georgmohr2008.pdf
Læs mereSEARCH ENGINE OPTIMIZATION
SEARCH ENGINE OPTIMIZATION Søgeord og online marketing v. Kristian Stoffregen Tørning, Lektor (MPL) / Maj 2013 Program 1. Hvordan søger brugerne? 2. Hvordan ved søgemaskinen, hvad der er relevant? 3. Praktisk
Læs mereVejledning til opbygning af hjemmesider
Side 1 af 9 Vejledning til opbygning af hjemmesider Hvis du er inde på din klubs hjemmeside, fx på forsiden, kan du nu gå i gang med at redigere. For at få redigeringsværktøjet frem, skal du klikke på
Læs mereApache Lucene og Solr
Apache Lucene og Solr Jana Kunert feymour@gmail.com The Camp 2015 July 21, 2015 1 / 25 Table of Contents Hvem er jeg Lucene Søgning Indeksering Querying Solr Hvorfor Solr? Demo Hvad skal jeg bruge? Links
Læs mereWebside score akcpdistributor.de.cutestatvalue.com
Webside score akcpdistributor.de.cutestatvalue.com Genereret Juli 19 2019 10:28 AM Scoren er 47/100 SEO Indhold Titel akcp-distributor.de is worth $ 8.95 - Website Worth, Calculator Længde : 64 Perfekt,
Læs meredpersp Uge 40 - Øvelser Internetalgoritmer
Øvelse 1 dpersp Uge 40 - Øvelser Internetalgoritmer (Øvelserne 4 og 6 er afleveringsopgaver) a) Hver gruppe får en terning af instruktoren. Udfør 100 skridt af nedenstående RandomWalk på grafen, som også
Læs mere6 Ugers Digital Markedsførings Uddannelse. Online Marketing SEO Præsentation Anders Sevelsted Bigum&Co Amagerbrogade
6 Ugers Digital Markedsførings Uddannelse Bigum&Co Kursist hemmeligt Anders Sevelsted Underviser & Foredragsholder Teori Vs. Praksis Viden Vs. Færdigheder Hvad forventes det i kan når vi er færdig? Skal
Læs mereTerminologi. Search Engine Marketing (SEM) Search Engine Optimization (SEO) Black Hat SEO White Hat SEO Pay Per Click (PPC)
Terminologi Search Engine Marketing (SEM) Search Engine Optimization (SEO) Black Hat SEO White Hat SEO Pay Per Click (PPC) Definition 1 SEO is a technique which helps search engines find and rank your
Læs mereAarhus d. 5 maj 2011
Aarhus d. 5 maj 2011 Tobias Thaastrup-Leth, 31 år, Århus Online Marketing Chef i OnlineMedier ApS & Søgemedier A/S Webdesign siden 1998 Online markedsføring siden 2002 Larry Page & Sergey Brin, Stanford
Læs mereWebside score seo-haip.com
Webside score seo-haip.com Genereret Maj 08 2019 15:11 PM Scoren er 44/100 SEO Indhold Titel Seo Haip Længde : 8 Kan optimeres; Optimalt bør din titel indeholde mellem 10 og 70 karakterer (med mellemrum)
Læs mereBilag 1: Ordliste. Bilag 1: Ordliste 141
Bilag 1: Ordliste 141 Bilag 1: Ordliste Da det behandlede område indeholder mange nye termer, som ikke nødvendigvis alle kender, og da disse termer opfattes forskelligt, har vi udarbejdet denne ordliste,
Læs mereSøgemaskineoptimering. Sådan kommer du til tops i Google af Dansk Internet Erhverv
Søgemaskineoptimering Sådan kommer du til tops i Google af Dansk Internet Erhverv Agenda: Kl. 9.00 - kl. 9.10 Velkomst ved salgschef Kim Thrane Kl. 9.10 - kl. 9.40 Præsentation af CMS ved Kim Thrane Kl.
Læs mereMålet for disse slides er at beskrive nogle algoritmer og datastrukturer relateret til at gemme og hente data effektivt.
Merging og hashing Mål Målet for disse slides er at beskrive nogle algoritmer og datastrukturer relateret til at gemme og hente data effektivt. Dette emne er et uddrag af kurset DM507 Algoritmer og datastrukturer
Læs mereSøgning på Internettet
Side 1 af 6 Indhold: Søgning på Internettet Tips til søgning på Internettet... 1 Præcis adresse:... 1 Indeks- søgning... 2 Søgerobotterne/søgemaskiner:... 3 Lidt om hvordan man søger på nettet... 4 Links...
Læs merePHP Quick Teknisk Ordbog
PHP Quick Teknisk Ordbog Af Daniel Pedersen PHP Quick Teknisk Ordbog 1 Indhold De mest brugte tekniske udtryk benyttet inden for web udvikling. Du vil kunne slå de enkelte ord op og læse om hvad de betyder,
Læs mereMålet for disse slides er at diskutere nogle metoder til at gemme og hente data effektivt.
Merging og hashing Mål Målet for disse slides er at diskutere nogle metoder til at gemme og hente data effektivt. Dette emne er et uddrag af kurset DM507 Algoritmer og datastrukturer (2. semester). Mål
Læs mereSEO. en digital værktøjskasse for begyndere og øvede
SEO en digital værktøjskasse for begyndere og øvede 1 Indholdsfortegnelse Hvad er SEO? 3 Stryg til tops i søgning og salg 4 Trends og stats om SEO 5 Best practices for SEO 6 4 gode råd til indhold 10 Linkbuilding
Læs mereProgrammeringscamp. Implementer funktionerne én for én og test hele tiden.
Programmeringscamp De to opgaver træner begge i at lave moduler som tilbyder services der kan bruges af andre, samt i at implementere services efter en abstrakt forskrift. Opgave 1 beder jer om at implementere
Læs mereAGENDA. Lidt om mig Markedsføring Hvorfor SEM? SEM Hvad består det af? DJØF Fredag d. 30. maj kl 16-18. Adwords SEO
AGENDA DJØF Fredag d. 30. maj kl 16-18 Lidt om mig Markedsføring Hvorfor SEM? SEM Hvad består det af? Adwords SEO 1 Sarah Vos Thrysøe Arbejde 10 år hos IBM bl.a. som pipeline analytiker Udarbejdelse af
Læs mereDM507 Algoritmer og datastrukturer
DM507 Algoritmer og datastrukturer Forår 2013 Projekt, del I Institut for matematik og datalogi Syddansk Universitet 5. marts, 2013 Dette projekt udleveres i to dele. Hver del har sin deadline, således
Læs mere- søgemaskineoptimering
- søgemaskineoptimering Guiden findes på bredahl-it.dk/seo Forventninger til aftenen Introduktion PageRank (og Google toolbar) Optimere webstedet (SEO) Trafikkontrol og statistikker Google Analytics Husk
Læs mereInformationssøgning metoder og scenarier
Informationssøgning metoder og scenarier Patrizia Paggio Center for Sprogteknologi Københavns Universitet patrizia@cst.dk Disposition Forskellige systemer IR, IE og QA Information Retrieval (IR) Boolean
Læs mereSkriftlig Eksamen Algoritmer og Datastrukturer (dads)
Skriftlig Eksamen Algoritmer og Datastrukturer (dads) Datalogisk Institut Aarhus Universitet Mandag den 27. maj 2002, kl. 9.00 13.00 Opgave 1 (25%) Denne opgave handler om multiplikation af positive heltal.
Læs mereRolf Fagerberg. Forår 2013
Forår 2013 Mål for i dag Dagens program: 1 2 3 4 5 6 Forudsætninger: DM536 og DM537 Timer: 50% forelæsninger, 50% øvelser Forudsætninger: DM536 og DM537 Eksamenform: Skriftlig eksamen: Timer: 50% forelæsninger,
Læs mereSortering. Eksempel: De n tal i sorteret orden
Sortering 1 / 32 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden 6, 2, 9, 4, 5, 1, 4, 3 1, 2, 3, 4, 4, 5, 9 2 / 32 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden
Læs mereSEO og Kommunikation
SEO og Kommunikation Agenda 1. Kommunikation på nettet 2. SEO hvad er det? 3. Teknisk SEO 4. Søgeordsanalyse 5. On-page SEO 6. Off-page SEO Kommunikation på nettet Kend din målgruppe Hvilke kunder har
Læs mereGAS ET VARME ANE. Januar ,2. Februar ,6. Marts ,4. April ,3
EnergiHotline Telefoniske & personlige henvendelser JAN - DEC Måned EL ANE EL ET GAS ANE GAS ET VARME ANE VARME ET ANDET Sum Gns. pr. arbejds-dag Januar 32 17 3 1 7 13 10 83 4,2 Februar 48 17 7 1 11 10
Læs mereGrafer og graf-gennemløb
Grafer og graf-gennemløb Grafer En mængde V af knuder (vertices). En mængde E V V af kanter (edges). Dvs. ordnede par af knuder. Grafer En mængde V af knuder (vertices). En mængde E V V af kanter (edges).
Læs mereSEO Checklist. Sikre at du får det hele med! Thomas Gajhede. Blog og podcast om online marketing
SEO Checklist Sikre at du får det hele med! Thomas Gajhede Blog og podcast om online marketing Introduktion Denne SEO-checkliste er lavet til dig, som skal at i gang med dit SEO-arbejde på din hjemmeside.
Læs mereTilgang til data. To udbredte metoder for at tilgå data: Sekventiel tilgang Random access: tilgang via ID (også kaldet key, nøgle) for dataelementer.
Merging og Hashing Tilgang til data To udbredte metoder for at tilgå data: Sekventiel tilgang Random access: tilgang via ID (også kaldet key, nøgle) for dataelementer. API for sekventiel tilgang (API =
Læs mereLinAlgDat 2014/2015 Google s page rank
LinAlgDat 4/5 Google s page rank Resumé Vi viser hvordan lineære ligninger naturligt optræder i forbindelse med en simpel udgave af Google s algoritme for at vise de mest interessante links først i en
Læs mereSortering. Eksempel: De n tal i sorteret orden
Sortering 1 / 34 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden 6, 2, 9, 4, 5, 1, 4, 3 1, 2, 3, 4, 4, 5, 9 2 / 34 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden
Læs mereSortering af information er en fundamental og central opgave.
Sortering Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden 6, 2, 9, 4, 5, 1, 4, 3 1, 2, 3, 4, 4, 5, 9 Mange opgaver er hurtigere i sorteret information (tænk på ordbøger, telefonbøger,
Læs mereGerth Stølting Brodal Aarhus Universitet
Gerth Stølting Brodal Aarhus Universitet Science Center Sorø - 4. september 2009 Overblik Hvem er jeg? Hvad er MADALGO? Algoritmiske problemstilling? Vidensspredning Gerth Stølting Brodal Cand. scient.,
Læs mereTilgang til data. To udbredte metoder for at tilgå data: Sekventiel tilgang Random access: tilgang via ID (key, nøgle) for dataelementer.
Merging og Hashing Tilgang til data To udbredte metoder for at tilgå data: Sekventiel tilgang Random access: tilgang via ID (key, nøgle) for dataelementer. API for sekventiel tilgang (API = Application
Læs mereGrafer og graf-gennemløb
Grafer og graf-gennemløb Grafer En mængde V af knuder (vertices). En mængde E V V af kanter (edges). Dvs. ordnede par af knuder. Grafer En mængde V af knuder (vertices). En mængde E V V af kanter (edges).
Læs mereGrafer og graf-gennemløb
Grafer og graf-gennemløb Grafer En mængde V af knuder (vertices). En mængde E V V af kanter (edges). Dvs. ordnede par af knuder. Grafer En mængde V af knuder (vertices). En mængde E V V af kanter (edges).
Læs mere74% 74% 29 gode Signaler. 29 emner fundet. Søgeord le chasse. SEO Rapport. le-chasse.com/ Sæt de vigtige ting over folden.
29 gode Signaler 29 emner fundet side Grade Sæt de vigtige ting over folden. Hastighed SEKUNDER 0.48 KILOBYTES 428.78 FORESPØRGSLER 7 Denne side loader hurtigt nok! Størrelsen på denne side er okay Antallet
Læs mereINDHOLDSFORTEGNELSE. Googles historie... Forord KAPITEL TO... 19. Introduktion til Google AdWords. Opret din AdWords-konto
INDHOLDSFORTEGNELSE Googles historie... Forord KAPITEL ET... 9 Introduktion til Google AdWords Hvad er en søgemaskine?... 10 Hvad er Google AdWords?...11 Eksempel på en AdWords-annonce... 12 Googles partnernetværk...
Læs mereDM507 Algoritmer og datastrukturer
DM507 Algoritmer og datastrukturer Introduktion til kurset Rolf Fagerberg Forår 2019 1 / 20 Hvem er vi? Underviser: Rolf Fagerberg, Institut for Matematik og Datalogi (IMADA) Forskningsområde: algoritmer
Læs mereDatastrukturer (recap)
Dictionaries Datastrukturer (recap) Data: Datastruktur = data + operationer herpå En ID (nøgle) + associeret data. Operationer: Datastrukturens egenskaber udgøres af de tilbudte operationer (API for adgang
Læs mere13.1 Matrixpotenser og den spektrale radius
SEKTION 3 MATRIXPOTENSER OG DEN SPEKTRALE RADIUS 3 Matrixpotenser og den spektrale radius Cayley-Hamilton-sætningen kan anvendes til at beregne matrixpotenser: Proposition 3 (Lasalles algoritme) Lad A
Læs merePHP 3 UGERS FORLØB PHP, MYSQL & SQL
PHP 3 UGERS FORLØB PHP, MYSQL & SQL Uge 1 & 2 Det basale: Det primære mål efter uge 1 og 2, er at få forståelse for hvordan AMP miljøet fungerer i praksis, og hvordan man bruger PHP kodesproget til at
Læs mereIntroduktion til DM507
Introduktion til DM507 Rolf Fagerberg Forår 2017 1 / 20 Hvem er vi? Underviser: Rolf Fagerberg, IMADA Forskningsområde: algoritmer og datastrukturer 2 / 20 Hvem er vi? Underviser: Rolf Fagerberg, IMADA
Læs mereRolf Fagerberg. Forår 2015
Forår 2015 Dagens program 1 2 3 4 5 Underviser:, IMADA Forskningsområde: algoritmer og datastrukturer Underviser:, IMADA Forskningsområde: algoritmer og datastrukturer Deltagere: BA i Datalogi BA i Software
Læs mereDM507 Algoritmer og datastrukturer
DM507 Algoritmer og datastrukturer Forår 2019 Projekt, del III Institut for matematik og datalogi Syddansk Universitet 10. april, 2019 Dette projekt udleveres i tre dele. Hver del har sin deadline, således
Læs mereInvarianter. Invariant: Et forhold, som vedligeholdes af algoritmen gennem (dele af) dens udførelse. Udgør ofte kernen af ideen bag algoritmen.
Invariant: Et forhold, som vedligeholdes af algoritmen gennem (dele af) dens udførelse. Udgør ofte kernen af ideen bag algoritmen. Invariant: Et forhold, som vedligeholdes af algoritmen gennem (dele af)
Læs mereSkriftlig Eksamen Algoritmer og Datastrukturer (DM507)
Skriftlig Eksamen Algoritmer og Datastrukturer (DM507) Institut for Matematik og Datalogi Syddansk Universitet, Odense Onsdag den 0. juni 009, kl. 9 Alle sædvanlige hjælpemidler (lærebøger, notater, osv.)
Læs mereWebkorpora: Yahoo API og perl
Webkorpora: Yahoo API og perl Jakob Halskov jh.id@cbs.dk Ph.d.-studerende Terminologi og korpuslingvistik den 21. februar 2006 1. Hvad er et API? 2. Hent din egen udviklernøgle! 3. Gennemgang af koden
Læs mereEG Data Inform. Byggebasen. WCF og webservices. Jens Karsø
EG Data Inform Byggebasen WCF og webservices Jens Karsø 10 Indholdsfortegnelse Byggebasen Services indledning... 2 Målsætning... 2 Valg af teknologier... 3 Kommunikationsmodel for byggebasen... 3 Services.byggebasen.dk...
Læs mereOpenTele Server Performance Test Rapport
OpenTele Server Performance Test Rapport 17. marts 2015 Side 1 af 22 1Indholdsfortegnelse Indholdsfortegnelse Indledning Test forudsætning Beskrivelse af testscenarier Test af OpenTele kliniker web interface
Læs mereWebside score google.com
Webside score google.com Genereret Januar 14 2019 10:26 AM Scoren er 37/100 SEO Indhold Titel Google Længde : 6 Kan optimeres; Optimalt bør din titel indeholde mellem 10 og 70 karakterer (med mellemrum)
Læs mereWebside score khtsb.com
Webside score khtsb.com Genereret April 04 2019 09:19 AM Scoren er 50/100 SEO Indhold Titel Welcome to XAMPP Længde : 16 Perfekt, din titel indeholder mellem 10 og 70 bogstaver. Beskrivelse XAMPP is an
Læs mereOverview LINKING METRICS BACKLINKS TYPES. URL Rating Domain Rating Backlinks Referring Domains. Referring Pages 173. text 173. Total Backlinks 184
Overview URL Rating Domain Rating Backlinks Referring Domains 12 35 184 11 0 0 0 0 LINKING METRICS Referring Pages 173 Total Backlinks 184 Crawled Pages 1 Referring IPs 9 Referring Subnets 8 Referring
Læs mereAlgoritmer og datastrukturer Course No. 02105 Cheat Sheet 2012. May 15, 2012
Algoritmer og datastrukturer Course No. 02105 Cheat Sheet 2012 May 15, 2012 1 CONTENTS 2012 CONTENTS Contents 1 Kompleksitet 3 1.1 Køretid................................................ 3 1.2 Asymptotisk
Læs mereRolf Fagerberg. Forår 2012
Forår 2012 Mål for i dag Dagens program: 1 2 3 4 5 6 Forudsætninger: DM502 og DM503 Timer: 50% forelæsninger, 50% øvelser Forudsætninger: DM502 og DM503 Eksamenform: Skriftlig eksamen: Timer: 50% forelæsninger,
Læs mereWordCamp Denmark Hurtigere websites med simple optimeringer. Tobias Borg Petersen Digicure A/S
WordCamp Denmark Hurtigere websites med simple optimeringer Tobias Borg Petersen Digicure A/S Hvem er jeg Tobias Borg Petersen Team Lead & Performancekonsulent Front End udvikler (.NET) tbp@digicure.dk
Læs mere\ \ Computerens Anatomi / /
HTX Roskilde - mat-it-prog, 1.4 \ \ Computerens Anatomi / / Introduktion En PC ( personlige computer ) eller computer er bygget op af forskellige komponenter. Vi vil hermed gennemgå størstedelen af computerens
Læs mereDannelse af PDF dokumenter
Dannelse af PDF dokumenter Indhold Dannelse af PDF-dokumenter i Phd Planner... 2 Valg af vedhæftninger i PDF dokumentet... 2 Valg af skabelon for PDF dokumentet... 3 Når PDF filen er dannet... 5 Gem PDF
Læs mereAlgoritmer og Datastrukturer 1. Gerth Stølting Brodal
Algoritmer og Datastrukturer 1 Gerth Stølting Brodal Kursusbeskrivelsen Kursusbeskrivelsen: Algoritmer og datastrukturer 1 Formål Deltagerne vil efter kurset have indsigt i algoritmer som model for sekventielle
Læs mereWebside score skillers.tech
Webside score skillers.tech Genereret Marts 28 2019 16:56 PM Scoren er 55/100 SEO Indhold Titel Skillers - Quality IT Recruiting services Længde : 41 Perfekt, din titel indeholder mellem 10 og 70 bogstaver.
Læs mereIndhold. Side 1 af 6. Internet Explorer 7 Internet Explorer 7
Internet Explorer 7 Side 1 af 6 Indhold Internet Explorer 7...1 Indhold...1 Nye ting i Internet Explorer 7...2 Nyt udseende...2 Faneblade...2 Nemmere søgning...3 Nemme nyheder...3 Bedre sikkerhed...5 Understøttelse
Læs mereSortering af information er en fundamental og central opgave.
Sortering 1 / 36 Sortering Input: Output: Eksempel: n tal De n tal i sorteret orden 6, 2, 9, 4, 5, 1, 4, 3 1, 2, 3, 4, 4, 5, 6, 9 Mange opgaver er hurtigere i sorteret information (tænk på ordbøger, telefonbøger,
Læs mereAlgoritmer og Datastrukturer 1. Gerth Stølting Brodal
Algoritmer og Datastrukturer 1 Gerth Stølting Brodal Kursusbeskrivelsen Kursusbeskrivelsen: Algoritmer og datastrukturer 1 Formål Deltagerne vil efter kurset have indsigt i algoritmer som model for sekventielle
Læs mereDM507 Algoritmer og datastrukturer
DM507 Algoritmer og datastrukturer Forår 2012 Projekt, del II Institut for matematik og datalogi Syddansk Universitet 15. marts, 2012 Dette projekt udleveres i tre dele. Hver del har sin deadline, således
Læs mereHanne Wick, Wick Kommunikation Aps
Tekster til web Oplæg af Hanne Wick, Wick Kommunikation Aps Digital Markedsføring 2011 Hanne Wick, Wick Kommunikation Aps Har siden 1983 arbejdet med kommunikation, markedsføring og PR, siden 1999 med
Læs mereDM507 Algoritmer og datastrukturer
DM507 Algoritmer og datastrukturer Forår 2018 Projekt, del II Institut for matematik og datalogi Syddansk Universitet 20. marts, 2019 Dette projekt udleveres i tre dele. Hver del har sin deadline, således
Læs mereInternet vs WWW. Internettet er IKKE det samme som www. Internettet Er et netværk af computere Gør det muligt af dele information
web som medie Internet vs WWW Internettet er IKKE det samme som www. Internettet Er et netværk af computere Gør det muligt af dele information Internet protokoller (forskellige måder at udveksle information
Læs mereGuide til MetaTraffic Pro
Guide til MetaTraffic Pro - dit statistikværktøj på din webside eller webshop DanaWeb benytter statistikværktøjet MetaTraffic Pro både på basis hjemmesiderne og til webshop hjemmesiderne. Du vil derfor
Læs mereWebdesign og webkommunikation. 10. april: Søgemaskiner, optimering og tilgængelighed
Webdesign og webkommunikation 10. april: Søgemaskiner, optimering og tilgængelighed Program Kage næste gang: Lærerne! 10-12 Søgemaskineoptimering Tilgængelighed 13-15 Vejledning Husk: Obligatorisk opgave
Læs mereHosting.dk. Rapport oprettet Introduktion. Table of Contents. Iconography. Link analyse. Svært at løse. Godt. Lidt svært at løse
57 Hosting.dk Rapport oprettet 04-09-2018 Introduktion Table of Contents Søgemaskineoptimering Brugervenlighed Mobil Teknologi Besøgende Social Link analyse Iconography Godt Svært at løse Behov for forbedring
Læs mereSIP. Session Initiation Protocol TDC IP telefoni Scale. SIP design mål
Session Initiation Protocol TDC IP telefoni Scale design mål Give mulighed for at integrere nye faciliteter efterhånden som de opfindes er ikke en erstatning for det offentlige telefonnet - er helt sin
Læs mereDM507 Algoritmer og datastrukturer
DM507 Algoritmer og datastrukturer Forår 2016 Projekt, del I Institut for matematik og datalogi Syddansk Universitet 29. februar, 2016 Dette projekt udleveres i tre dele. Hver del har sin deadline, således
Læs mereDM507 Algoritmer og datastrukturer
DM507 Algoritmer og datastrukturer Forår 2016 Projekt, del III Institut for matematik og datalogi Syddansk Universitet 20. april, 2016 Dette projekt udleveres i tre dele. Hver del har sin deadline, således
Læs mereReceptoroncology.dk. Rapport oprettet Introduktion. Table of Contents. Iconography. Link analyse. Svært at løse. Godt. Lidt svært at løse
57 Receptoroncology.dk Rapport oprettet 26-09-2018 Introduktion Table of Contents Søgemaskineoptimering Brugervenlighed Mobil Teknologi Besøgende Social Link analyse Iconography Godt Svært at løse Behov
Læs mereTechboblen. om Google, Big Data og de sociale medier
Indsæt nyt billede: Format: B25,4 x 19,05 cm Klik på billed-ikonet midt på slidet. Find dit nye billede, højreklik på billedet og placér det bagerst. Techboblen om Google, Big Data og de sociale medier
Læs mereWebside score rankingtodayseobookmarking.net
Webside score rankingtodayseobookmarking.net Genereret Maj 29 2019 13:18 PM Scoren er 64/100 SEO Indhold Titel SEO Links Ranking Today Bookmarking Add Article Længde : 49 Perfekt, din titel indeholder
Læs mereHvad Hvorfor Hvordan
Hvad Hvorfor Hvordan Hent OpenKapow Installer programmet OpenKapow er et enkelt program til at bygge robotter for at skrabe data på nettet. Programmet er gratis at hente og bruge. Det findes i en linux-
Læs mereErfaringer med Information Management. Charlottehaven Jens Nørgaard, NNIT A/S jnqr@nnit.com
Erfaringer med Information Management Charlottehaven Jens Nørgaard, NNIT A/S jnqr@nnit.com Agenda Hvor ligger virksomhedens information gemt og hvor opstår kravet til at finde denne information. Find Find
Læs mere72% 72% 29 gode Signaler. 29 emner fundet. Søgeord Kundeservicekursus. SEO Rapport. Sæt de vigtige ting over folden.
29 gode Signaler 29 emner fundet side Grade Sæt de vigtige ting over folden. Hastighed SEKUNDER 1.57 KILOBYTES 1405.36 FORESPØRGSLER 21 Denne side loader hurtigt nok! Størrelsen på denne side er okay Antallet
Læs mereDM507 Algoritmer og datastrukturer
DM507 Algoritmer og datastrukturer Forår 2019 Projekt, del I Institut for matematik og datalogi Syddansk Universitet 27. februar, 2019 Dette projekt udleveres i tre dele. Hver del har sin deadline, således
Læs mereMikonsulenten.dk. Rapport oprettet Introduktion. Table of Contents. Iconography. Link analyse. Svært at løse. Godt. Lidt svært at løse
63 Mikonsulenten.dk Rapport oprettet 06-11-2018 Introduktion Table of Contents Søgemaskineoptimering Brugervenlighed Mobil Teknologi Besøgende Social Link analyse Iconography Godt Svært at løse Behov for
Læs mere1. Redegør for Lister, stakke og køer mht struktur og komplexitet af de relevante operationer
1. Redegør for Lister, stakke og køer mht struktur og komplexitet af de relevante operationer på disse. Typer af lister: Array Enkelt linket liste Dobbelt linket Cirkulære lister Typer af køer: FILO FIFO
Læs mereUndgå DNS Amplification attacks
Undgå DNS Amplification attacks 29. november 2013 Til: Den it-sikkerhedsansvarlige Resumé Center for Cybersikkerhed har i den seneste tid set flere DDoS-angreb mod danske myndigheder og private virksomheder.
Læs mereWeb CMS kontra Collaboration
Web CMS kontra Collaboration Sammenligning mellem Sitecore og Sharepoint Lars Fløe Nielsen, Evangelism ln@sitecore.net Page 1 Sitecore har dyb integration til Microsoft Sitecore har integration til mange
Læs mereEncoding:...1 Et tegn sæt (character set):...1 UTF-8 og UTF-16 (Unicode):...2
Encoding:...1 Et tegn sæt (character set):...1 UTF-8 og UTF-16 (Unicode):...2 Encoding: Vi har tidligere set på spørgsmålet om et XML dokuments encoding. Det er generelt altid en god ide at gemme et dokument
Læs mereDATALOGISK INSTITUT, AARHUS UNIVERSITET
DATALOGISK INSTITUT, AARHUS UNIVERSITET Det Naturvidenskabelige Fakultet EKSAMEN Grundkurser i Datalogi Antal sider i opgavesættet (incl. forsiden): 6 (seks) Eksamensdag: Fredag den 0. august 00, kl. 9.00-.00
Læs mereIntroduktion til datastrukturer. Introduktion til datastrukturer. Introduktion til datastrukturer. Datastrukturer
Introduktion til datastrukturer Introduktion til datastrukturer Philip Bille Datastrukturer Datastruktur. Metode til at organise data så det kan søges i/tilgås/manipuleres effektivt. Mål. Hurtig Kompakt
Læs mereMåned EL GAS VARME ANDET Sum. Januar ,6. Februar ,9. Marts ,9. April ,8
EnergiHotline Telefoniske & personlige henvendelser JAN - DEC Måned EL GAS VARME ANDET Sum Gns. pr. arbejds-dag Januar 30 2 9 17 58 2,6 Februar 31 4 8 14 57 2,9 Marts 39 4 1 12 56 2,9 April 26 0 5 4 35
Læs mere