Een wetenschappelijke studie naar de claim van Yahoo! dat hun index nagenoeg 2,5 keer groter zou zijn dan Google ondersteunt de kritiek eerder geuit door onder meer Google technici. Het onderzoek dat gedurende 18 uur werd uitgevoerd werd verricht door de NCSA (National Center for Supercomputing Applications) samen met de Universiteit van Illinois.
De methode die werd gevolgd is als volgt:
“The first is that both the Yahoo! and the Google search engine return all the results that match the particular keywords and does not do any filtering beyond removing duplicate results. The second is if Yahoo!’s index contains more than twice as many documents as Google’s index (19.2 billion documents to 8.1 billion documents), a series of random searches to both search engines should return more than twice as many results from Yahoo! than Google.”
Dat bleek gedeeltelijk toepasbaar. Het is namelijk zo dat zowel Google als Yahoo! de zoekresultaten afkappen als er meer dan 1000 zoekresultaten zijn.
De conclusie die uit dit onderzoek komt geeft het vermoeden aan dat de claim van Yahoo! wel eens niet geheel waar kan zijn.
“…that a user can expect, on average, to receive 166.9% more results using the Google search engine than the Yahoo! search engine. In fact, in the 10,012 test cases we ran, only in 3% of the cases (307) did Yahoo! return more results. In 96.6% of the cases (9676) Google returned more results. In less than 1% of the cases (29) both search engines returned the same number of results.”
Echter het zeker weten doen we nooit. Beide zoekmachines laten tenslotte geen onafhankelijk partij toe om daadwerkelijk te toetsen of de geclaimde omvang correct is. Bovendien is er geen maatstaf beschikbaar hoe je de omvang van de database daadwerkelijk kunt definieren.
(Overigens als je dit onderzoek wilt overdoen, dan kan dat. De broncode van het programma waarmee het onderzoek naar de omvang van beide indexen is gedaan is vrij beschikbaar.)
[bron]