Google Pagerank Hvordan man finder en nål i en høstak



Relaterede dokumenter
LinAlgDat 2014/2015 Google s page rank

13.1 Matrixpotenser og den spektrale radius

F i l o s o f i e n o g m at e m at i k k e n b ag G o o g l e. M e d fo k u s på Pag e R a n k.

Filosofien og matematikken bag Google

Internetsøgemaskiner. Gerth Stølting Brodal Datalogisk Institut Aarhus Universitet

Sådan virker. (måske) Gerth Stølting Brodal. Datalogisk Institut Aarhus Universitet

Søgning på Internettet

Perspektiverende Datalogi Internetalgoritmer. Gerth Stølting Brodal

Google fem ting de kan forbedre og fem gode ting

INDHOLDSFORTEGNELSE. Googles historie... Forord KAPITEL TO Introduktion til Google AdWords. Opret din AdWords-konto

Her vil jeg gerne være Det er sådan dine kunder skal tænke

dpersp Uge 40 - Øvelser Internetalgoritmer

Matematik og FormLineære ligningssystemer

Matematik og Form 3. Rækkereduktion til reduceret echelonfo. Rang og nullitet

Formler, ligninger, funktioner og grafer

Aarhus d. 5 maj 2011

Danhost Webshop. Bliv fundet på Google

Kort introduktion til Google.

Ligningssystemer - nogle konklusioner efter miniprojektet

Åbne IT-værksteder fra oktober til og med februar

Teoretiske Øvelsesopgaver:

Synlighed på nettet. Oplæg af Hanne Wick, Wick Kommunikation for Erhvervskvinder Århus

Københavns Universitet, Det naturvidenskabelige Fakultet. Afleveringsopgave 3

Guide til informationssøgning ved idrætsstudiet på Institut for Idræt. Per Kahlen Hansen Biblioteket

Skriftlig Eksamen Algoritmer og Datastrukturer (dads)

Matematik for økonomer 3. semester

Internettet. Tema. på ipad Opdateret d Ældresagens datastue Aktivitetscentret Bavnehøj. Nørre Snede Tema: Internettet på ipad

Kursusgang 3 Matrixalgebra Repetition

MATEMATIK 7. KLASSE. Web 3

Anvendt Lineær Algebra

Kvadratiske matricer. enote Kvadratiske matricer

Matematik: Stuktur og Form Lineære ligningssystemer

Hanne Wick, Wick Kommunikation Aps

Computerstøttet beregning

Lineære ligningssystemer og Gauss-elimination

Funktioner og ligninger

De fire elementers kostbare spejl

brug nettet / lær at søge effektivt

Secret sharing - om at dele en hemmelighed Matematiklærerdag 2017

BLIV FUNDET PÅ GOOGLE! Hvorfor er det vigtigt? Hvad er Google (en søgemaskine)? Hvordan fungerer den? Hvad er SEO?

Det Ingeniør-, Natur- og Sundhedsvidenskabelige basisår Matematik 2A, Forår 2007, Hold 4 Opgave A Kommenteret version

Lineær Algebra - Beviser

Selvstudium 1, Diskret matematik

Matematisering af redoxprocessers afstemning 1

6 Ugers Digital Markedsførings Uddannelse. Online Marketing SEO Præsentation Anders Sevelsted Bigum&Co Amagerbrogade

Lineær algebra: Spænd. Lineær (u)afhængighed

Matematik Basis. Faglige mål. Kernestof. Supplerende stof

Anvendt Lineær Algebra

Matricer og lineære ligningssystemer

Chapter 3. Modulpakke 3: Egenværdier. 3.1 Indledning

Webdesign og webkommunikation. 10. april: Søgemaskiner, optimering og tilgængelighed

To ligninger i to ubekendte

World Wide Web Det verdensomspændende spindelvæv Søgemaskinerne Portal eller fritekst Viggo Liebmann Hansen

Kan anbefalinger af anbefalere anbefales?

Internetsøgemaskiner

Intet af dette finder nødvendigvis sted for en hjemmeside på Internettet!

Aflevering 4: Mindste kvadraters metode

Vordingborg Bibliotek Præstø Bibliotek Møn Bibliotek

Perspektiverende Datalogi 2011

Plant nu - Høst senere

Algebra - Teori og problemløsning

Søgemaskineoptimering. Sådan kommer du til tops i Google af Dansk Internet Erhverv

Søgning og Sortering. Philip Bille

Differentialligninger med TI-Interactive!

Blogger i Picasa. Hvad er Blogger egentlig? På Picasa s billedbakke er der et stort ikon der vises som et B

Har du mødt Google? Af Lars Kai Hansen

Eksamensopgaver i LaTeX-delen af IT-1B

Projekt 7.9 Euklids algoritme, primtal og primiske tal

Hvad er en relationsdatabase? Odense, den 19. januar Version 1.0

Techboblen. om Google, Big Data og de sociale medier

Lineær Algebra, kursusgang

Onsdags-workshops foråret 2014

Maj Ontasknaturally.com Case Studie. Hvordan E-Intelligence Sikrede Mere end 100% Tilbagebetaling På Investeringen til Ontasknaturally.

Internettet og Web 2.0

Affine rum. a 1 u 1 + a 2 u 2 + a 3 u 3 = a 1 u 1 + (1 a 1 )( u 2 + a 3. + a 3. u 3 ) 1 a 1. Da a 2

SEO-strategi. Kunde logo

Module 1: Lineære modeller og lineær algebra

Lineær algebra: Matrixmultiplikation. Regulære og singulære

Tips til søgning i. Anne Bagger & Anders Otte Stensager, Københavns Universitetsbibliotek.

DesignMat Lineære differentialligninger I

SEO GUIDE AF DATA CREATIVES IVS

Om workshops i IT-HJØRNET: Onsdags-workshops Forår Gratis kurser: På nettet: IT-HJØRNETS hjemmeside:

Vistemmernu. Et webbaseret værktøj udviklet af Programdatateket i Skive. programdatateket@viauc.dk Web:

Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 3 Faglig kontakt under eksamen: Carl Fredrik Berg Telefon: 7359

Bliv opdaget på Internettet! - 10 gode råd til at optimere din hjemmeside til søgemaskiner

CV FORM MÅLGRUPPE KOMMENTARER

MASO Uge 8. Invers funktion sætning og Implicit given funktion sætning. Jesper Michael Møller. Department of Mathematics University of Copenhagen

Matematik og Form Splines. NURBS

Lineær Algebra. Lars Hesselholt og Nathalie Wahl

Københavns Universitet, Det naturvidenskabelige Fakultet. Afleveringsopgave 4

Årsplan 8. Klasse Matematik Skoleåret 2016/17

DesignMat Lineære differentialligninger I

Appendiks: Andre Google-programmer

Årsplan for 7. klasse, matematik

DesignMat Uge 5 Systemer af lineære differentialligninger II

Om at løse problemer En opgave-workshop Beregnelighed og kompleksitet

Fraktaler Mandelbrots Mængde

Undervisningsbeskrivelse

Matematikkens metoder illustreret med eksempler fra ligningernes historie. Jessica Carter Institut for Matematik og Datalogi, SDU 12.

Kursusgang 3 Matrixalgebra fortsat

Transkript:

Google Pagerank Hvordan man finder en nål i en høstak Georg Mohr, 4. marts 2008 Kim Knudsen kim@math.aau.dk Institut for Matematiske Fag Aalborg Universitet http://www.math.aau.dk/ kim/georgmohr2008.pdf Google Pagerank p. 1/22

Internettet - informationsalderen Moderne teknologis største vidunder: Kommunikation, globalisering, information, demokrati?... Google Pagerank p. 2/22

Internettet - informationsalderen Moderne teknologis største vidunder: Kommunikation, globalisering, information, demokrati?... Historie: 1957: USSR sender Sputnik i kredsløb om jorden US DoD etablerer Advanced Research Projects Agency ( 58) 1969: ARPANET. Første netværk med packet switching (modsætning til circuit switching). 1988: Internettet åbnes for kommercielle interesser 1991: World Wide Web lanceres 2008: www har 1.1 mia. brugere og 20 mia. hjemmesider Google Pagerank p. 2/22

Internettet - informationsalderen Moderne teknologis største vidunder: Kommunikation, globalisering, information, demokrati?... Historie: 1957: USSR sender Sputnik i kredsløb om jorden US DoD etablerer Advanced Research Projects Agency ( 58) 1969: ARPANET. Første netværk med packet switching (modsætning til circuit switching). 1988: Internettet åbnes for kommercielle interesser 1991: World Wide Web lanceres 2008: www har 1.1 mia. brugere og 20 mia. hjemmesider Internettet indeholder alverdens viden og information(?). Informationsøgning: Hvordan finder man en nål i en høstak? Søgemaskiner: yahoo!, msn, google... Google Pagerank p. 2/22

Udsnit af internettet (0.0001%) Google Pagerank p. 3/22

Google Inc., kort fortalt Google er (et af) verdens mest succesfyldte IT-firmaer med hovedkontor i Mountain View, CA. Grundlagt i 1998 af Larry Page og Sergey Brin Google Pagerank p. 4/22

Google Inc., kort fortalt Google er (et af) verdens mest succesfyldte IT-firmaer med hovedkontor i Mountain View, CA. Grundlagt i 1998 af Larry Page og Sergey Brin Mission: At organisere verdens information og gøre den universelt tilgængelig Motto: Don t do evil! Google Pagerank p. 4/22

Google Inc., kort fortalt Google er (et af) verdens mest succesfyldte IT-firmaer med hovedkontor i Mountain View, CA. Grundlagt i 1998 af Larry Page og Sergey Brin Mission: At organisere verdens information og gøre den universelt tilgængelig Motto: Don t do evil! Verdens mest brugte søgemaskine, google.com (>50% af alle søgninger) Google Pagerank p. 4/22

Google Inc., kort fortalt Google er (et af) verdens mest succesfyldte IT-firmaer med hovedkontor i Mountain View, CA. Grundlagt i 1998 af Larry Page og Sergey Brin Mission: At organisere verdens information og gøre den universelt tilgængelig Motto: Don t do evil! Verdens mest brugte søgemaskine, google.com (>50% af alle søgninger) Andre web-baserede applikationer: Google earth, gmail, google groups, google video, google Picasa, Froogle... Google Pagerank p. 4/22

Google Inc., kort fortalt Google er (et af) verdens mest succesfyldte IT-firmaer med hovedkontor i Mountain View, CA. Grundlagt i 1998 af Larry Page og Sergey Brin Mission: At organisere verdens information og gøre den universelt tilgængelig Motto: Don t do evil! Verdens mest brugte søgemaskine, google.com (>50% af alle søgninger) Andre web-baserede applikationer: Google earth, gmail, google groups, google video, google Picasa, Froogle... Pengene tjenes idag primært på reklamer ifm. søgemaskinen, gmail mm. I fremtiden? Google Pagerank p. 4/22

Google Inc., kort fortalt Google er (et af) verdens mest succesfyldte IT-firmaer med hovedkontor i Mountain View, CA. Grundlagt i 1998 af Larry Page og Sergey Brin Mission: At organisere verdens information og gøre den universelt tilgængelig Motto: Don t do evil! Verdens mest brugte søgemaskine, google.com (>50% af alle søgninger) Andre web-baserede applikationer: Google earth, gmail, google groups, google video, google Picasa, Froogle... Pengene tjenes idag primært på reklamer ifm. søgemaskinen, gmail mm. I fremtiden? Hvorfor navnet google? Googol = 10 100 Google Pagerank p. 4/22

Googles succes Vi er vilde med googles søgemaskine fordi 1. Den er simpel 2. Den er hurtig 3. Den kommer med de rigtige svar på selv håbløse forespørgsler Google Pagerank p. 5/22

Googles succes Vi er vilde med googles søgemaskine fordi 1. Den er simpel 2. Den er hurtig 3. Den kommer med de rigtige svar på selv håbløse forespørgsler Er der penge i det? Larry Page og Sergey Brin er begge nr. 26 på Forbes liste over verdens rigeste. Er begge gode for 16.6 mia. USD. Google Pagerank p. 5/22

Googles succes Vi er vilde med googles søgemaskine fordi 1. Den er simpel 2. Den er hurtig 3. Den kommer med de rigtige svar på selv håbløse forespørgsler Er der penge i det? Larry Page og Sergey Brin er begge nr. 26 på Forbes liste over verdens rigeste. Er begge gode for 16.6 mia. USD. Google inc. tjente i 4. kvartal 2007 ca. 6 mia. $ (skuffende resultat...) Google Pagerank p. 5/22

Googles succes Vi er vilde med googles søgemaskine fordi 1. Den er simpel 2. Den er hurtig 3. Den kommer med de rigtige svar på selv håbløse forespørgsler Er der penge i det? Larry Page og Sergey Brin er begge nr. 26 på Forbes liste over verdens rigeste. Er begge gode for 16.6 mia. USD. Google inc. tjente i 4. kvartal 2007 ca. 6 mia. $ (skuffende resultat...) Microsoft bød fornylig 225 mia. kr. for yahoo Google Pagerank p. 5/22

Princippet i googles søgemaskine 1. WWW kravles igennem af en web-crawler (web-spider). For enhver side som nås gemmes bl.a. sidens adresse, sidens tekst og sidens links (referencer til andre hjemmesider). Data gemmes i gigantisk database (antal sider n 20 10 9 ) 2. Enhver side tildeles et tal (1-10), sidens PageRank, som angiver sidens vigtighed 3. Ved en forespørgsel på google.com findes i databasen de sider, som indeholder søgeordene, og siderne præsenters for forespørgeren i en rækkefølge afhængig af (blandt andet) PageRank Google Pagerank p. 6/22

Princippet i googles søgemaskine 1. WWW kravles igennem af en web-crawler (web-spider). For enhver side som nås gemmes bl.a. sidens adresse, sidens tekst og sidens links (referencer til andre hjemmesider). Data gemmes i gigantisk database (antal sider n 20 10 9 ) 2. Enhver side tildeles et tal (1-10), sidens PageRank, som angiver sidens vigtighed 3. Ved en forespørgsel på google.com findes i databasen de sider, som indeholder søgeordene, og siderne præsenters for forespørgeren i en rækkefølge afhængig af (blandt andet) PageRank Nøglen bag succesen er Googles (patenterede) PageRank algoritme. En algoritme der baserer sig på matematik Google Pagerank p. 6/22

Matematisk model for WWW WWW modelleres ved en orienteret (multi-)graf: Enhver hjemmeside repræsenteres ved et punkt i grafen. Hvis der er et link fra siden P i til siden P j så repræsenteres det ved en orienteret kant fra punktet hørende til P i til punktet hørende til P j. Google Pagerank p. 7/22

Matematisk model for WWW WWW modelleres ved en orienteret (multi-)graf: Enhver hjemmeside repræsenteres ved et punkt i grafen. Hvis der er et link fra siden P i til siden P j så repræsenteres det ved en orienteret kant fra punktet hørende til P i til punktet hørende til P j. Eksempel på mini-www: P 1 P 3 P 2 P 4 Hvilken side i netværket er den vigtigste? Google Pagerank p. 7/22

Tre basale principper PageRank bygger på tre demokratiske principper: 1. Ethvert link tæller som en stemme. En sides vigtighed afhænger af, hvormange andre sider, der stemmer på den 2. Jo større vigtighed en side har, jo større vægt tildeles et udgående link fra siden 3. Jo færre links (=stemmer), der går ud fra en side, jo større vægt tildeles hvert link Google Pagerank p. 8/22

Tre basale principper PageRank bygger på tre demokratiske principper: 1. Ethvert link tæller som en stemme. En sides vigtighed afhænger af, hvormange andre sider, der stemmer på den 2. Jo større vigtighed en side har, jo større vægt tildeles et udgående link fra siden 3. Jo færre links (=stemmer), der går ud fra en side, jo større vægt tildeles hvert link Hvis x i angiver vigtigheden af side P i : P 1 P 3 x 1 = x 3 /1 + x 4 /2 x 2 = x 1 /3 x 3 = x 1 /3 + x 2 /2 + x 4 /2 P 2 P 4 x 4 = x 1 /3 + x 2 /2 Google Pagerank p. 8/22

Lineære ligningssystemer Reduktion x 1 = x 3 + x 4 2 x 2 = x 1 3 x 3 = x 1 3 + x 2 2 + x 4 2 x 4 = x 1 3 + x 2 2 0 = x 1 + x 3 + x 4 2 0 = x 1 3 x 2 0 = x 1 3 + x 2 2 x 3 + x 4 2 0 = x 1 3 + x 2 2 x 4 Det er et kvadratisk, homogent lineært ligningssystem. Sådanne ligningssystemer kan have enten én (i givet fald (0, 0, 0, 0)) eller uendeligt mange løsninger. Google Pagerank p. 9/22

PageRank løsningen Vores ligningssystem har uendeligt mange løsninger på formen (x 1,x 2,x 3,x 4 ) = t(12, 4, 9, 6), t. Normalisering: Vi vælger den positive løsning, som giver samlet PageRank en: x 1 + x 2 + x 3 + x 4 = 1 (x 1,x 2,x 3,x 4 ) = 1 (12, 4, 9, 6) 31 PageRank løsningen er altså (x 1,x 2,x 3,x 4 ) = 1 (12, 4, 9, 6) 31 Google Pagerank p. 10/22

Lineær algebra Hvis vi introducerer link-matricen 0 0 1 1/2 1/3 0 0 0 A = 1/3 1/2 0 1/2 1/3 1/2 0 0 så er det opskrevne ligningssystem ækvivalent med Ax = x, x = [x 1,x 2,x 3,x 4 ]. Google Pagerank p. 11/22

Lineær algebra Hvis vi introducerer link-matricen 0 0 1 1/2 1/3 0 0 0 A = 1/3 1/2 0 1/2 1/3 1/2 0 0 så er det opskrevne ligningssystem ækvivalent med Ax = x, x = [x 1,x 2,x 3,x 4 ]. Den beskrevne problemstilling kan behandles med redskaber fra den del af matematikken, der hedder lineær algebra. Lineær algebra bruges overalt! Mobiltelefon, ipod, computerspil, beregning af vejrudsigt, MP3-afspiller, digitalkamera... Google Pagerank p. 11/22

Opgave Betragt netværket P 1 P 3 P 2 P 4 Opskriv de fire ligninger med fire ubekendte (x1,x 2,x 3,x 4 ), som kan bruges til at bestemme PageRank for netværket. Løs de fire ligninger og find den normaliserede PageRank løsning Google Pagerank p. 12/22

Problem 1: Hængende sider Netværket P 1 P 3 P 2 giver anledning til ligningerne Google Pagerank p. 13/22

Problem 1: Hængende sider Netværket P 1 P 3 P 2 giver anledning til ligningerne x 1 = x 2 x 2 = x 1 2 x 3 = x 1 2 Kan vi finde en normaliseret løsning? Google Pagerank p. 13/22

Ny stokstisk model: En tilfældig surfer En www-surfer bevæger sig tilfældigt rundt på nettet Fra en side P med N udgående links vil han med lige fordelt sandsynlighed (1/N) vælge mellem de udgående links PageRank løsningen x = (x 1,x 2,x 3,...,x n ) kan fortolkes som en sandsynlighedsfordeling, hvor x i angiver sandsynligheden for, at surferen til et vilkårligt tidspunkt (efter lang tid) befinder sig på siden P i. Google Pagerank p. 14/22

Ny stokstisk model: En tilfældig surfer En www-surfer bevæger sig tilfældigt rundt på nettet Fra en side P med N udgående links vil han med lige fordelt sandsynlighed (1/N) vælge mellem de udgående links PageRank løsningen x = (x 1,x 2,x 3,...,x n ) kan fortolkes som en sandsynlighedsfordeling, hvor x i angiver sandsynligheden for, at surferen til et vilkårligt tidspunkt (efter lang tid) befinder sig på siden P i. Problem: Hængende sider, sider som ikke indeholder links. Google Pagerank p. 14/22

Ny stokstisk model: En tilfældig surfer En www-surfer bevæger sig tilfældigt rundt på nettet Fra en side P med N udgående links vil han med lige fordelt sandsynlighed (1/N) vælge mellem de udgående links PageRank løsningen x = (x 1,x 2,x 3,...,x n ) kan fortolkes som en sandsynlighedsfordeling, hvor x i angiver sandsynligheden for, at surferen til et vilkårligt tidspunkt (efter lang tid) befinder sig på siden P i. Problem: Hængende sider, sider som ikke indeholder links. Løsning (googles): Fra enhver side uden udgående links indsættes virtuelle links til enhver anden side i netværket. Google Pagerank p. 14/22

Løsning: Hængende sider For netværket P 1 P 3 indsætter vi virtuelle links fra P 3 til P 1 og P 2. P 2 Google Pagerank p. 15/22

Løsning: Hængende sider For netværket P 1 P 3 P 2 indsætter vi virtuelle links fra P 3 til P 1 og P 2. Det giver os x 1 = x 2 + x 3 2 x 2 = x 1 2 + x 3 2 x 3 = x 1 2 Den normaliserede løsning (x 1,x 2,x 3 ) = 1 9 (4, 3, 2) Google Pagerank p. 15/22

Problem 2: Usammenhængende netværk Betragt netværket P 1 P 3 P 2 P 4 Hvilke ligninger giver netværket anledning til? Findes der en entydig normaliseret løsning? Google Pagerank p. 16/22

Løsning: Usammenhængende netværk En yderligere modifikation: Når vores www-surfer står på side P, så giver vi ham to muligheder: 1. Med sandsynlighed α vil han som tidligere følge et udgående link fra P 2. Med sandsynlighed (1 α) vil han springe til en vilkårlig side i netværket Google Pagerank p. 17/22

Løsning: Usammenhængende netværk En yderligere modifikation: Når vores www-surfer står på side P, så giver vi ham to muligheder: 1. Med sandsynlighed α vil han som tidligere følge et udgående link fra P 2. Med sandsynlighed (1 α) vil han springe til en vilkårlig side i netværket Det svarer til at der i ligningen for ethvert x j på højresiden ganges med α og leddet tilføjes højresiden. + 1 α n (x 1 + x 2 + + x n ) Samlet set giver det PageRank ligningerne for netværket. I googles PageRank er α 0.85 Google Pagerank p. 17/22

Google-ligningerne for eksemplet For netværket P 1 P 3 P 2 P 4 får vi x 1 = αx 2 + (1 α)(x 1 + x 2 + x 3 + x 4 )/4 x 2 = αx 1 + (1 α)(x 1 + x 2 + x 3 + x 4 )/4 x 3 = αx 4 + (1 α)(x 1 + x 2 + x 3 + x 4 )/4 x 4 = αx 3 + (1 α)(x 1 + x 2 + x 3 + x 4 )/4 Ikke overraskende er den normaliserede løsning x 1 = x 2 = x 3 = x 4 = 1 4 Google Pagerank p. 18/22

Går det altid godt? Hundred år gammel matematik giver et klart svar på spørgsmålet om eksistens og entydighed af en PageRank løsning: Sætning: (Perron 1907): Givet et ligningssystem opstået udfra et netværk som ovenfor beskrevet (med modifikationer til løsning af problem 1-2). Da findes altid en entydig normaliseret og positiv løsning! Google Pagerank p. 19/22

Hvordan beregnes løsningen? Kompleksiteten for løsning af ligningssystemer er n 2 (n er antallet af ligninger). Dyrt når n 10 9. (10 18 operationer på en 3GHz maskine tager 4000 døgn!) Vi kan bruge en iterativ algoritme til at beregne løsningen: Givet (x (0) 1,x (0) 2,x (0) 2,x (0) 3 ) defineres rekursivt for k 1 x (k) 1 = αx (k 1) 2 + (1 α)(x (k 1) 1 + x (k 1) 2 + x (k 1) 3 + x (k 1) 4 )/4 x (k) 2 = αx (k 1) 1 + (1 α)(x (k 1) 1 + x (k 1) 2 + x (k 1) 3 + x (k 1) 4 )/4 x (k) 3 = αx (k 1) 4 + (1 α)(x (k 1) 1 + x (k 1) 2 + x (k 1) 3 + x (k 1) 4 )/4 x (k) 4 = αx (k 1) 3 + (1 α)(x (k 1) 1 + x (k 1) 2 + x (k 1) 3 + x (k 1) 4 )/4. Da vil (x (k) 1,x (k) 2,x (k) 2,x (k) 3 ) (x 1,x 2,x 2,x 3 ) når k. I praksis er det tilstrækkeligt med k = 50. Google Pagerank p. 20/22

Med mere... Googles algoritme bygger på mange andre elementer end link-analyse, herunder Analyse af hjemmesidens titel, tekst (naturligt sprog) Site troværdighed (.edu og.gov står stærkere end.com) Alderen på hjemmesiden og sitet Omdømmet af de sider, der linker til hjemmesiden (mange link fra upålidelige kilder giver anledning til dårlig score) Blacklisting af kendte, utroværdige sider (link farms) Google sørger for at give et varieret svar på forespørgsler Google Pagerank p. 21/22

Litteratur Kurt Bryan and Tanya Leise, The $25.000.000.000 Eigenvector: The Linear Algebra behind Google, SIAM Review 48 (3), 2006 Amy N. Langville and Carl D. Meyer, Google s PageRank and Beyond, Princeton University Press, 2006 D. Laksov, Matematikk og Informasjonssøkning på nettet, Normat 51 (3), 2003 Google Pagerank p. 22/22