Zoekmachine spam bedreigt Google

Zoekmachine spam bedreigt Google
Afgelopen weekend werd een groot geval van zoekmachine spam ontdekt bij Google. Het bleek te gaan om een groot aantal recent geregistreerde domeinen, waarvan er per domein al gauw ettelijke miljoenen pagina’s in de Google index staan. (bovenstaande is het resultaat van site:t1ps2see.com.Afgelopen donderdag was aan Eric Schmidt al de vraag gesteld over deze kwestie. Ook Matt Cutts kreeg de vraag voor de kiezen hoe dit nu kan gebeuren. Beide heren konden of wilden geen commentaar geven. De situatie is echter wel zorgwekkend. Het blijkt namelijk dat zoekmachine spammers relatief gemakkelijk miljoenen pagina’s in de index van Google kunnen krijgen.De pagina’s maken gebruik van javascript cloaking en 302 redirects. Verder schijnt het zo te zijn dat door verwijzingen naar deze sites vanuit ‘lekke’ software van forums, blogs commentaren en dergelijke deze pagina’s zo snel zijn geindexeerd.

Aan de gebruikte techniek is duidelijk te zien waar de manco’s zitten van Google. Zo is in dit geval gebruik gemaakt van subdomeinen. Google ziet elk subdomein als een aparte site. Het is dus niet zo dat er van bovenstaand domein 706 miljoen pagina’s zijn geindexeerd, nee, er zijn 706 miljoen nieuwe sites opgenomen. Opvallend is overigens dat alleen Google hier last van heeft, zowel Yahoo! als MSN zijn kennelijk beter in staat zich te wapenen tegen dit soort zoekmachine spam. Zie:

http://search.yahoo.com/search?p=sit…e.com&ei=UTF-8

http://search.msn.com/results.aspx?q…3At1ps2see.com

Het blijkt dat Yahoo! ca. 11.000 pagina’s heeft opgenomen en MSN slechts 110. Het kan uiteraard een kwestie van tijd zijn, maar nu heeft MSN duidelijk minder zoekmachine spam gerelateerde pagina’s.

Overigens is Google al bezig met opruimwerkzaamheden. Enkele dagen geleden werden er nog 2 miljard pagina’s gevonden voor bovenstaand domeinnaam. Nu dus nog maar ruim 700 miljoen…

De pagina’s verwijzen overigens allen naar PPC directories. Degene die dit heeft opgezet loopt in ieder geval aardig binnen zo. Overigens is aan de naamgeving van de subdomeinen te zien dat het doel van de sites ook zo is dat het maar enkele dagen actief is…

Posted in: