Op forums als Voelspriet of WebmasterWorld wordt regelmatig de vraag gesteld hoeveel nu daadwerkelijk van een pagina geindexeerd wordt. Van Google is het inmiddels bekend dat ze niet meer dan 101Kb indexeert. (ookal staat Google bekend als een full-text zoekmachine) – zie bijvoorbeeld het voorbeeld aardvark apple zither zephyr filetype:html –
Van Yahoo is het nog niet zo bekend, echter het blijkt dat zij standaard het limiet op 150Kb hebben staan voor HTML. Het grappige is echter dat als je zoekt in Yahoo met het bovenstaande voorbeeld aardvark apple zither zephyr originurlextension:html, dan zie je dat er veel grotere bestandsformaten worden genoemd. Het lijkt er zelfs op dat Yahoo deze pagina’s volledig heeft geindexeerd.
Met andere woorden als je zoekt naar informatie in omvangrijke pagina’s, dan is het verstandiger om Yahoo te gebruiken.