for dummies
Om
gericht informatie te zoeken op internet gebruiken de meeste mensen één of
meerdere zoekmachines. In mijn blogbericht van 14 november (The Chinese Way)
ging ik al even kort in op de populairste Chinese zoekmachine, Baidu. Dit keer
gaan we het iets minder ver zoeken en nemen we de werking van de bekendste
westerse zoekmachine onder de loep: Google. Google werd in 1998 gelanceerd door
de Amerikanen Larry Page (°1973) en Sergey Brin (°1973), die op dat moment aan een
onderzoeksproject op de Universiteit van Stanford werkten.
Het PageRank-systeem
De
methode die Google gebruikt voor de ranking van websites is het
PageRank-systeem. Op zijn blog EdWords.nl definieert Eduard Blacquière het
systeem als volgt: PageRank
is een nummerieke waarde die Google aan alle bij Google bekende individuele
webpaginas toewijst, op basis van de naar een webpagina verwijzende links, om
te bepalen hoe belangrijk deze webpaginas zijn ten opzichte van elkaar.
Om het belang van een website te meten kijkt
Google dus naar de onderlinge links tussen websites. Twee termen zijn daarbij van
belang: hubs en authorities. Hubs (elke gelijkenis met een bestaande Brusselse
school berust op toeval ) zijn paginas die veel linken naar andere paginas. Authorities zijn paginas waar veel naar gelinkt wordt. Op de website van The
Stanford Natural Language Processing Group wordt beschreven wat een goede hub
en wat een goede authority is: A good hub page is one that points to many good
authorities; a good authority page is one that is pointed to by many good hub
pages. Een typische
autoriteit is Wikipedia, aangezien heel wat andere webpaginas linken naar
Wikipedia. Over de kwaliteit kan natuurlijk gediscussieerd worden. Het is niet
omdat er bijzonder veel naar een pagina gelinkt wordt, dat de inhoud van die
pagina ook per definitie oké is.
Google bombing
Het PageRank-systeem is echter ook
beïnvloedbaar. Op kunstmatige wijze kunnen bepaalde websites een hogere plaats
krijgen in de ranking. Men spreekt dan van een Google bomb. In december 2003
kregen mensen die op Google miserabe failure intikten als eerste
zoekresultaat de officiële biografie van president George Bush op de website
van het Witte Huis te zien. Een Google bomb maken bleek op dat moment ook
tamelijk eenvoudig te zijn: One reporter noticed that of the over 800 links
pointing to the Bush biography, only 32 used the phrase miserable failure in
the anchor text, which meant Google bombing was not only fun, it was easy. (Langville &
Meyer 2012: 55) De oprichters van Google deden niet meteen pogingen om een
oplossing te vinden voor Google bombing. Hun eerste reactie was dat de ranking
de heersende opinies op het web weerspiegelt. Dus: veel auteurs van
internetpaginas bleken ermee akkoord te gaan dat George Bush een echte miserable
failure was. Vanaf 2004 dreven ze wel de strijd op tegen het fenomeen.
Bronnen:
Langville,
A. & Meyer, C. (2012). Googles
PageRank and Beyond. The Science of Search Engine Rankings. Princeton: Princeton University Press.
05-12-2012 om 00:00
geschreven door Carmino D'haene 
Tags: Google, PageRank, hubs, authorities, Google bombs
|