Iedereen heeft het wel eens gedaan: een zoekwoord ingeven in een zoekmachine, gewoon om te kijken hoeveel zoekresultaten dat zoekwoord genereert. Je kan dat enerzijds doen om de kijken hoe populair een bepaald zoekwoord is, of gewoon om te kijken wat de juiste schrijfwijze is van dat zoekwoord. Maar hoe accuraat is dat aantal zoekresultaten nu eigenlijk? Een journalist van de BBC ging op onderzoek.
Een simpele zoekopdracht zorgde al meteen voor enkele verrassende resultaten. De naam van een populaire BBC-radiopresentator leverde op de ene PC 835.000 resultaten, op een andere PC 325.000, op nog een andere PC kwamen 285.000 resultaten tevoorschijn, enzovoort. Dezelfde zoekopdracht op verschillende computers in hetzelfde kantoor en op hetzelfde tijdstip leverde dus al sterk variërende resultaten op.
De eerste conclusie is dat het aantal zoekresultaten afhangt van de computer waarop dat zoekwoord is ingegeven, en welke kopie van Google wordt gebruikt. Er zijn namelijk verschillende kopieën van Google, en je zoekopdracht zal worden gedispatched naar die versie die de minst lange wachtrij heeft.
Daarnaast worden zoekresultaten natuurlijk ook voor een deel gepersonaliseerd. Dit gepersonaliseerde deel wordt bepaald door wat je in het verleden al als zoekopdracht ingaf, en waar je je fysiek bevind.
De kans dat het aantal zoekresultaten minder accuraat is, zal natuurlijk toenemen indien ook je zoekopdracht niet echt accuraat gedefinieerd is. Indien je bijvoorbeeld een heel ambigue of dubbelzinnige zoekopdracht ingeeft, dan zal de kans groter zijn dat het aantal zoekopdrachten sterk varieert. Maar zelfs indien je je zoekopdracht verfijnt, door bijvoorbeeld aanhalingstekens te gebruiken, dan nog kan het aantal resultaten verschillen.
Kortere zoekopdrachten accurater
Onderzoekers kwamen erachter dat zoekopdrachten die uit één enkel woord bestonden het meest accurate aantal zoekopdrachten opleverde. Werden er twee woorden ingegeven als zoekopdracht, dan daalde de accuraatheid van het aantal zoekresultaten al met de helft. Bij zoekopdrachten met vijf woorden was het aantal zoekresultaten nog eens voor de helft minder accuraat.
Volgens experten wordt dit gebrek aan precisie aanvaard ten gunste van de snelheid waarmee zoekmachines te werk gaan. Supercomputers dienen immers achter de schermen heel snel vele documenten te doorlopen en te matchen, en de spam en vergelijkbare sites eruit te halen. Dit alles moet in slechts 1 of 2 seconden gebeuren.
Slechts een fractie geïndexeerd
Een andere reden voor het gebrek aan precisie bij zoekmachines is het immense karakter van het wereldwijde web. Al in 1999 berekenden experten dat zoekmachines slechts 16% van het wereldwijde web indexeerden. Sinds die tijd zijn zoekmachines natuurlijk wel geëvolueerd, maar ook het internet is gegroeid. Hoeveel procent op dit moment wordt geïndexeerd is moeilijk te zeggen, maar er wordt vanuit gegaan dat het nog steeds slechts een fractie is.
Zoekmachines indexeren voornamelijk grote websites als eerste, en ontdekken nadien andere websites door middel van de links die vertrekken vanuit die websites. Hier vallen vele kleinere websites uit de boot, en ontsnappen ze aan de aandacht van zoekmachines. Indien je dus wil dat Google jouw site snel indexeert, kan je er best voor zorgen dat je snel enkele kostbare links bemachtigt van andere websites. Op die manier is de kans groter dat zoekmachines je website sneller zullen vinden.